如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的服务;影响服务:选择影响服务(可多选);进展摘要:处理人将事件升级为故障...

应用故障自动诊断

故障定界:这部分包含了诊断模型推测的导致应用故障的浅层原因,一般包含以下3种情况:应用的某个实例故障导致的整体故障。应用的某个接口或者服务故障导致的整体故障。应用的下游应用故障导致本应用故障。根因分析:这部分包含了...

修改DDH故障迁移配置

如果本地SSD型DDH出现故障,您可以提交工单申请人工迁移,但迁移后本地盘数据丢失。DDH因故障迁移完成后,DDH ID及ECS实例的元数据(例如实例ID、私有IP地址、公网IP地址)均保持不变,但是由于更换了物理服务器,DDH的机器码改变。...

ConnectionDisconnect

ConnectionDisconnect事件提示您智能接入网关的主备IPsec链路都出现故障。告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介故障注入流程如下所示:在服务中,其实现方式为:管控台...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则登录 SOFAStack 控制台。在左侧菜单栏选择 中间件...

故障演练常见问题

刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主账号合并计费,子账号的所有消费均扣减主账号余额。icmsDocProps={'productMethod':'created','...

跨可用区容灾

当生产站点因为不可抗力因素(比如火灾、地震)或者设备故障、硬件破坏)导致应用在短时间内无法恢复时,混合云容灾服务支持业务的跨可用区(Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的RTO/RPO核心指标...

跨可用区容灾

当生产站点因为不可抗力因素(比如火灾、地震)或者设备故障、硬件破坏)导致应用在短时间内无法恢复时,混合云容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的RTO...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。一次完整的故障...

管理集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专属...

管理集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专属...

管理PostgreSQL集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专属...

管理MySQL集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase基本信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专...

ack-node-repairer

当节点出现故障时,自愈系统自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

服务应用问题定位及故障演练

本文介绍服务应用问题定位及故障演练的场景描述、解决问题、架构图及操作参考链接。场景描述 您服务架构应用基于阿里云容器服务Kubernetes(ACK)部署,通过阿里云业务实时监控ARMS发现服务应用的容错能力是否健壮、容器编排配置是否...

API概览

故障新增备注小计 FinishProblem 故障完结 ListProblemSubtotals 故障小计列表 RecoverProblem 故障恢复 ReplayProblem 故障复盘 RevokeProblemRecovery 故障撤销恢复 UpdateProblemNotice 更新故障通告 CreateProblemMeasure 创建故障改进...

故障隔离

某个服务故障或者异常时,如果该服务触发熔断造成整个服务的不可用。而故障隔离能够定位到异常的服务实例,实现实例级别精细化的隔离和摘流,使故障影响的范围更小、更可控。配置故障隔离规则登录 SOFAStack 控制台。在左侧菜单栏选择 ...

跨地域容灾

故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:在连续复制型容灾的受保护服务器页签中,单击要...

跨地域容灾

故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。按如下步骤进行故障切换:在受保护服务器页签,在要启动故障切换的...

读多写少型业务场景多活实践

多活容灾MSHA(Multi-Site High Availability)是在阿⾥巴巴电商业务环境演进出的多活容灾架构解决⽅案。本文通过一个电商业务导购链路案例,介绍典型的读多写少型业务场景,如何基于多活容灾...相关文档 什么故障演练 为什么需要多活容灾?

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

读多写少型业务场景多活实践

多活容灾MSHA(Multi-Site High Availability)是在阿⾥巴巴电商业务环境演进出的多活容灾架构解决⽅案。本文通过一个电商业务导购链路案例,介绍典型的读多写少型业务场景,如何基于多活容灾...相关文档 什么故障演练 为什么需要多活容灾?

流水单据型业务场景多活实践

多活容灾MSHA(Multi-Site High Availability)是在阿⾥巴巴电商业务环境演进出的多活容灾架构解决⽅案。本文通过一个电商业务下单链路案例,介绍典型的流水单据型业务场景,如何基于多活容灾...相关文档 什么故障演练 为什么需要多活容灾?

流水单据型业务场景多活实践

多活容灾MSHA(Multi-Site High Availability)是在阿⾥巴巴电商业务环境演进出的多活容灾架构解决⽅案。本文通过一个电商业务下单链路案例,介绍典型的流水单据型业务场景,如何基于多活容灾...相关文档 什么故障演练 为什么需要多活容灾?

产品优势

蚂蚁技术风险管理体系方法论+平台工具完整落地通过高可用管理平台工具,可以输出蚂蚁多年积累点的技术风险防控内容,并在此基础上助力用户建设符合用户实际情况的技术风险防控体系,提升用户整体技术风险防控水平。技术风险防控效率有效...

迁移有潜在故障风险的DDH

如果台DDH有潜在故障风险,其物理机处于可用状态,但随时可能出现故障,导致DDH中的ECS实例出现问题。您可以自主迁移有潜在故障风险的DDH到其他物理机,避免相关业务因DDH故障受到影响。前提条件 请先将DDH上的ECS实例全部停机,否则迁移...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

生命周期

故障 稳定状态 DDH出现故障。您可以提交工单检查并处理问题。是 已过期 稳定状态 包年包月DDH到期时出现的状态。对DDH续费后,DDH的状态变为运行中。续费详情,请参见手动续费DDH。是 已释放 稳定状态 包年包月DDH过期后自动释放进入...

应用场景

当其中部分ECS实例发生故障后,负载均衡自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾) 为了提供更加稳定可靠的负载均衡服务,阿里云负载均衡已在各地域部署了多可用区以...

创建MongoDB集群

如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后再替换故障主机。手动替换主机:用户需要手动替换故障主机。开放OS权限 专属集群MongoDB引擎的主机不提供操作系统(OS)权限,默认为关闭。首次使用该阿里云账号创建专...

基本概念

应用出现故障时,在阿里云上恢复应用的过程。故障恢复(Fail Back)当您的 IDC 内的环境恢复以后,将应用数据迁回自有 IDC 恢复应用运行的过程。RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,...

产品优势

本文介绍图数据库GDB的产品...当出现故障时,系统将基于主备故障的各种异常情况迅速将故障转移,保障业务连续性。图数据库GDB提供了丰富的数据库运维管理能力,包括备份恢复、自动升级、监控告警、故障切换等,能够帮助您大幅降低运维成本。

常见问题-FAQ

全局流量管理(GTM)和负载均衡(SLB)有什么区别?答:首先 GTM 是通过DNS将域名解析到多个IP地址,不同用户访问不同的IP地址,来实现应用服务流量的分配。同时通过健康检查动态更新DNS解析IP列表,实现故障隔离以及故障切换。最终用户的...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

ChaosBlade是款简单易用且功能强大的混沌实验实施工具,AHAS CHAOS故障演练是ChaosBlade的商业化产品。本文介绍AHAS CHAOS故障演练与开源ChaosBlade的能力对比。产品简介 开源ChaosBlade与商业化AHAS CHAOS故障演练的特点如下: 开源...

什么故障演练

故障演练是款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

代码逻辑场景

本文列故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:com.alibaba.service.XxxService。如果模拟接口故障,需...

应用场景

站式运维事件管理应用场景满足各类监控场景下报警统一事件化管理需求,支持集成对接各监控系统,支持服务器自定义推送异常事件,对报警、事件、故障进行全流程站式管理,提升企业运维效率。能够解决多源监控集成:支持多个常见监控系统...

应急预案:专有云V3环境中AnalyticDB相关机器故障紧急...

1.概述 本文主要介绍在专有云V3环境中,AnalyticDB相关机器故障紧急维修的RMA处理流程。1.1.适用范围 专有云V3企业版,AnalyticDB 1.2.用户告知 适用平台:x86 授权级别:L2(二线技术支持工程师)临时或固化方案:固化 操作复杂度:中 ...
来自: 首页

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。背景信息 目前阿里云的混合云容灾服务对本地的数据中心做保护,并实现在本地虚拟机出现故障的时候以秒级RPO、...
< 1 2 3 4 ... 147 >
共有147页 跳转至: GO
产品推荐
云服务器 负载均衡SLB 块存储 商标 物联网无线连接服务 SSL证书 轻量应用服务器 号码隐私保护
这些文档可能帮助您
后端服务器概述 ECS入门概述 添加安全组规则 选型最佳实践 添加TCP监听 在线扩容云盘(Windows系统)

新品推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折

你可能感兴趣

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化

热门推荐

切换为移动版

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折