运维事件中心

运维事件中心是企业业务连续性的运营管理平台,提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更...

负载均衡

负载均衡SLB(Server Load Balancer)是种对流量进行按需分发的服务,通过将流量分发到不同的端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的单点故障,提升应用系统的可用性。

全局流量管理

全局流量管理通过DNS实现应用服务的就近访问接入、多地址负载均摊,同时根据健康检查进行DNS Failover,实现应用服务的同城多活故障隔离和异地容灾。

阿里云试用中心,为您提供0门槛上云实践机会!

100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!
广告

应用高可用服务 AHAS

应用高可用服务AHAS是款专注于提高应用高可用能力的SaaS产品,提供应用架构自动探测、故障注入式高可用能力演练、键应用防护和增加功能开关等功能,可以快速低成本地提升应用可用性。

数据库自治服务 DAS

数据库自治服务DAS(Database Autonomy Service)是种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助您消除人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。

Node.js 性能平台

Node.js 性能平台(Node.js Performance ...应用提供性能监控、安全提醒、故障排查、性能优化等服务的整体性解决方案。\nNode.js 性能平台凭借对 Node.js 内核深入的理解,提供完善的工具链和服务,协助客户主动、快速发现和定位线上问题。

云数据库 OceanBase

自主研发的金融级分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 6100万次/秒处理峰值的业内纪录,在功能、稳定性、可扩展性、性能方面都...

性能分析

性能分析服务为移动 App 提供实时线上性能数据的“采集-分析-监控-告警...Android/iOS 应用类型,帮助客户建立 5 分钟线上故障感知能力,并与崩溃分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

崩溃分析

崩溃分析服务为移动 App 提供实时线上稳定性相关数据的“采集-分析-监控-告警”能力...应用类型,帮助客户建立 5 分钟线上故障感知能力,并与性能分析/远程日志服务配合使用,构建异常“感知-定位-恢复”的运维能力闭环,提升 App 使用体验。

演练场景说明

故障演练场景是演练任务的核心。AHAS提供基础资源类场景和Kubernetes类场景,帮助分布式系统提升容错性和可恢复性。每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

Container 演练场景

Kubernetes 集群中 Pod 资源下的容器故障场景,包含杀容器以及容器内故障场景。每个容器故障场景下都包含通用的容器筛选参数,用于查找目标容器。通用参数 参数名称 参数说明 Pod 资源名称 Pod 资源名称,多个资源名称之间使用逗号分隔,...

应用场景

站式运维事件管理应用场景满足各类监控场景下报警统一事件化管理需求,支持集成对接各监控系统,支持服务器自定义推送异常事件,对报警、事件、故障进行全流程站式管理,提升企业运维效率。能够解决多源监控集成:支持多个常见监控系统...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:com.alibaba.service.XxxService。如果模拟接口故障,需...

流水单据型业务场景多活实践

复现故障 改造完成容灾架构,还需验证容灾能力是否符合预期,接下来将历史故障进行复现,通过制造真实的故障来验证容灾恢复能力。演练准备。登录AHAS控制台。在控制台左侧导航栏选择多活容灾。在左侧导航栏选择监控大盘,在顶部菜单栏,...

流水单据型业务场景多活实践

复现故障 改造完成容灾架构,还需验证容灾能力是否符合预期,接下来将历史故障进行复现,通过制造真实的故障来验证容灾恢复能力。演练准备。登录AHAS控制台。在控制台左侧导航栏选择多活容灾。在左侧导航栏选择监控大盘,在顶部菜单栏,...

读多写少型业务场景多活实践

基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复判断业务的实际恢复情况。演练预期如下: 导购链路对购物车应用是弱依赖(导购页会展示用户放入购物车的商品数量),弱依赖故障...

读多写少型业务场景多活实践

基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复判断业务的实际恢复情况。演练预期如下: 导购链路对购物车应用是弱依赖(导购页会展示用户放入购物车的商品数量),弱依赖故障...

多应用服务场景如何实现批量切换流量

创建运营商级别故障的容灾预案,故障发生时可一键执行预案,实现将故障运营商下的访问流量快速切换到其他运营商下。创建地域(Region)级别的故障容灾预案,故障发生时可一键执行预案,实现将故障地域下的访问流量快速切换到其他地域...

多应用服务场景如何实现批量切换流量

创建运营商级别故障的容灾预案,故障发生时可一键执行预案,实现将故障运营商下的访问流量快速切换到其他运营商下。创建地域(Region)级别的故障容灾预案,故障发生时可一键执行预案,实现将故障地域下的访问流量快速切换到其他地域...

Node 演练场景

Kubernetes 集群中 Node 资源故障场景,包含 CPU、网络和进程等基础资源类演练场景。每个 Node 场景下都包含通用的 Node 筛选参数,用于查找目标 Node。通用参数说明 参数名称 参数说明 节点名称 节点资源名,选择多个节点资源时资源名之间...

Pod演练场景

Kubernetes集群中Pod资源故障场景,包含删除Pod和Pod网络异常场景。每个Pod场景下都包含通用的Pod筛选参数,用于查找目标Pod。通用参数 参数名称 参数说明 Pod资源名称 Pod资源名称,多个资源名称之间使用逗号分隔,表示选择多个Pod。Pod...

应用场景

当其中部分ECS实例发生故障后,负载均衡会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾) 为了提供更加稳定可靠的负载均衡服务,阿里云负载均衡已在各地域部署了多可用区以...

应用场景

异地主备满足容灾需求,两地不同城市分别建设两个机房,备,两地距离超过 1000 km,主机房承载业务流量,备机房无业务流量,只做备用机房使用。当主机房故障,可以切换流量到备机房快速恢复业务,等主机房故障恢复以后,再回切流量到...

使用场景

当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴专线方式都支持该场景的网络部署。场景二:面向大型...

应用场景

当3个IP地址中某一个地址故障时,将故障的地址从DNS解析列表中暂时删除,不向用户返回,当故障IP地址恢复,从新添加回DNS解析列表。使用 GTM 时,只需要建立一个地址池Pool A,然后把 1.1.1.1、2.2.2.2、3.3.3.3 三个地址添加进地址池,...

应用场景

当3个IP地址中某一个地址故障时,将故障的地址从DNS解析列表中暂时删除,不向用户返回,当故障IP地址恢复,从新添加回DNS解析列表。通过 GTM,创建一个地址池Pool A,包含地址(1.1.1.1、2.2.2.2、3.3.3.3),主地址池集合选择Pool A,并...

应用场景

服务网格ASM主要适用于需要对应用服务进行流量管理、安全管理、故障恢复、观测监控以及微服务架构迁移的应用场景。本文介绍ASM的常见应用场景。流量管理 通过ASM,可以轻松实现基于配置的流量管理: 将流量管理与基础设施管理分隔开来,并...

应用场景

场景:业务实时搜索当业务需要对海量数据进行多维度、实时的搜索时,关系型数据库显然力不从心。一个非常典型的例子就是对产品或者商品进行多维度搜索。此时,业务需要借助云搜 Zsearch(对标 Elaticsearch 的蚂蚁金服金融科技发布的弹性...

虚拟机场景

本文列出了虚拟机常见的故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

应用场景

工业大脑的使用场景如下图所。良率提升 您可以使用工业大脑平台,提升生产良品率,具体应用场景如下。光伏行业:企业借助工业大脑的人工智能技术提升光伏电池片生产A品率。公司首先把从车间实时采集到的上千个生产参数传入工业大脑,通过...

网络类场景

等)和延迟时间,对应用或服务注入网络调用延迟故障。验证网络延迟情况下系统的容错能力。表 1.参数说明 参数名称 参数说明 网卡名称 具体的网卡设备,为必选项,例如 eth0。本地服务端口 本地服务监听的端口,外部流量不允许通过此端口...

应用场景

使用混合云容灾网关,核心应用的服务器镜像、应用数据、文件等都被持续复制到阿里云上。如果自有 IDC 内应用出现难以恢复的故障时,您可以在阿里云上启动容灾恢复网关,快速在 ECS 上恢复应用服务器运行,使应用迅速重新上线,极大减少...

应用场景

打通,提供事务消息处理能力,可以保证业务链路完成时发送消息,任阶段异常时回滚消息。开发简单,在客户端声明一个注解,用以界定事务边界,调用 MQ 的事务API发送消息。​ 高可靠:在宕机、网络故障等情况下,严格保证数据一致性。节约...

典型应用场景

DTS为您提供不停机迁移的解决方案,只有当业务从源实例切换到目标实例期间会影响业务,其他时间业务均能正常提供服务,将停机时间降低到分钟级别,架构如下图所。整个迁移过程包含结构迁移、全量数据迁移及增量数据迁移三个阶段。当进入...

应用场景

故障关联分析:以应用为中心,覆盖组件、实例、主机、云资源等多维度关联分析,迅速找到异常故障点。问题分析与快速定位在分布式场景下,服务调用错综复杂,问题分析与定位非常困难,分布式链路跟踪系统能迅速定位到有问题的服务,协助快速...

应用场景

例如支持故障恢复通知与状态更新、故障未及时处理自动升级告警等。智能运维(AIOps) 开发人员和IT运维人员可结合使用日志服务的机器学习服务和告警功能,对海量的日志、时序数据进行智能监控,包括智能聚类、异常检测、异常预测等。日志...

应用场景

备份数据中心数据 本地数据中心发生无法短期恢复的故障时,从阿里云备份库上直接通过软件还原数据。备份阿里云云上数据 备份阿里云虚拟机上数据,利用内部网络带宽将数据高效地备份到HBR备份库。多分支机构统一备份管理 您可以使用HBR备份...

应用场景

实时监控产品的适用场景如下:基于应用的监控,包括系统硬件(CPU、负载、硬盘、内存等)、应用业务指标(SQL 耗时监测、页面访问量、调用量、数据库...实时发现运维过程中出现各种资源故障,及时发现、快速定位、及时修复,保证业务高可用。

应用场景

主节点对外提供服务,当主节点出现故障,系统自动切换备用节点接管服务,整个切换过程对用户全部透明。电商行业应用 电商行业中对于Redis大量使用,多数在商品展示、购物推荐等模块。场景:秒杀类购物系统 大型促销秒杀系统,系统整体...
< 1 2 3 4 ... 59 >
共有59页 跳转至: GO

新品推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折

你可能感兴趣

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化

热门推荐

切换为移动版

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折