故障隔离

某个服务故障或者异常时,如果该服务触发熔断会造成整个服务的不可用。而故障隔离能够定位到异常的服务实例,实现实例级别精细化的隔离和摘流,使故障影响的范围更小、更可控。配置故障隔离规则登录 SOFAStack 控制台。在左侧菜单栏选择 ...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。一次完整的故障...

为多语言应用配置故障注入

故障注入是一种模拟应用异常行为的技术,通过给应用注入特定故障,来检测该应用的消费者处理异常情况的能力,然后通过提升处理该异常情况能力的方式来提高系统的稳定性。本文介绍如何为多语言应用配置服务故障。创建故障注入规则 登录EDAS...

DDH故障迁移

一台DDH基于一台指定的物理服务器,可能会因为故障而自动停机。为了降低物理故障对您业务的影响,阿里云为您提供DDH故障迁移服务。您可以在创建DDH时或创建DDH后配置DDH故障迁移。创建DDH时,在其他设置区域,选中宿主机故障时自动迁移。...

物模型开发

设备属性上报 API原型 device#postProps(params,[callback])功能描述 上报属性 参数描述-params 属性参数,Object 类型-callback-res 服务端 reply 消息内容 示例代码:/上报设备属性 device.postProps({ LightSwitch:0 },(res)=gt;...

设备指示灯

智能接入网关设备指示灯的颜色和闪烁状态对应不同的设备使用情况。设备类型 指示灯 状态说明 SAG-100WM LTE 表示设备通讯是否正常:长亮或熄灭:设备通讯异常。闪烁:设备正常通讯。信号指示 表示4G LTE信号强度:3格信号强度。WAN 表示...

弹性Web托管服务等级指标

1.12服务赔偿条款1.12.1赔偿范围因阿里云设备故障、设计缺陷或操作不当导致用户所购买的服务无法正常使用,阿里云需要对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)预先通知用户后进行系统维护所引起的,包括割接...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:com.alibaba.service.XxxService。如果模拟接口故障,需...

CoAP连云HAL

HAL_DTLSSession_create 原型:DTLSContext*HAL_DTLSSession_create(coap_dtls_options_t*p_options);接口说明:调用此接口通过参数p_options指定的证书、服务器地址和端口建立DTLS连接,获取DTLS会话句柄。参数说明:参数 数据类型 方向 ...

应用场景

故障跟踪:支持对故障进展、故障影响面、舆情反馈、Timeline进行在线化管理、协同,提升故障处理效率。故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构化要求,形成了线上检查点,以产品的方式承载流程落地。故障改进:支持对...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

管理工作台

以上图为例,工作台展示了如下信息:今日涉及的任务名称:需求确认和原型搭建。某项任务需要完成的数量:需求确认任务今日需要完成2个;原型搭建任务今日需要完成0个。某项任务今日已完成的数量:需求确认任务今日已完成1个;原型搭建任务...

功能特性

产品主要功能包括风险管理、日常巡检、故障诊断、应急预案、故障演练等。风险管理风险管理 是高可用管理平台核心,是风险事件汇集、处置的中枢平台,具体如下。风险事件风险事件汇集:负责将监控、巡检、诊断产生的风险或告警信息进行汇总...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装案例云复制服务。更多信息,请参见步骤四:安装阿里云复制服务。操作...

账户接口

函数原型 public MychainBase<ReplyTransactionReceipt>createAccount(CreateAccountRequest request)请求参数 参数 必选 类型 说明 request true CreateAccountRequest 创建账户的请求 返回字段 返回字段 字段类型 说明 result ...

修改DDH故障迁移配置

为了降低物理故障对您业务的影响,阿里云为您提供DDH故障迁移服务。本章节介绍在创建DDH后如何修改DDH故障迁移配置。背景信息 故障迁移服务开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启DDH故障迁移服务,DDH发生故障停机...

常见问题-FAQ

注意 标准版最快可在4分钟左右准确发现故障并切换故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;全网生效时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL缓存...

本地通信HAL

HAL_UDP_close 原型:void HAL_UDP_close(_IN_intptr_t p_socket);接口说明:调用此接口销毁指定的UDP连接,释放资源。参数说明:参数 数据类型 方向 说明 p_socket intptr_t 输入 UDP socket句柄。返回结果说明:此接口无返回参数。HAL_...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>...

创建系统事件报警规则

智能接入网关支持的系统事件如下:事件类型 事件名称 详情 维护 接入点切换 AccessGatewayFailover 设备发生主备切换 DeviceSwitched 设备WAN链路切换 DeviceWanLinkSwitched 异常 设备被攻击 DeviceHacked 设备链路故障 DeviceLinkDown ...

功能优势

本文向您介绍故障演练产品的功能优势,故障演练以下简称 AHAS Chaos。灵活的流程编排 AHAS Chaos 将故障演练的环节分为了准备、注入、检查以及恢复四个阶段,每个阶段除了系统初始化完成的必要节点之外,您也可以根据需要添加所需的流程...

安全注意事项

安装注意事项边缘一体机的部署环境应满足基本环境要求,否则可能造成设备故障,由此引发的设备功能异常或部件损坏、人身安全事故、财产损失等不在设备质量保证范围之内。边缘一体机,必须安装在室内环境,并确保室内环境:无漏水、渗水等...

故障恢复

PROBLEM_UPDATE 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 返回数据 名称 类型 ...

跨地域容灾

容灾系统部署在阿里云上两个地域中,当主系统发生故障时,业务系统切换到容灾系统。主系统和容灾系统部署在不同的地域,可靠性更高,有效避免了地域性灾害导致的系统故障。准备工作 在实现跨地域容灾之前,您需要选择一个不同于生产环境的...

安全注意事项

安装注意事项边缘一体机应在符合安装环境要求的环境下使用,否则可能造成设备故障,由此引发的设备功能异常或部件损坏、人身安全事故、财产损失等不在设备质量保证范围之内。边缘一体机,必须安装在室内环境,并确保室内环境:无漏水、渗水...

FAQs

注意 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;DNS切换同步时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL缓存设置以及网络环境不同,所以全网生效时间...

故障撤销恢复

NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 clientToken String Body 否 FD200FAE-E98F-496E-BFE6-...

设计确认

在设计师设计制作网站过程中,用户可通过三次确认完成对网站原型、网站风格、网站内页的设计。Web端设计确认 网站原型确认:需求确认后将进入原型制作环节,完成时间为2个工作日内。原型制作完成后您会收到短信、邮件通知,并可以通过邮件...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

硬件功能说明

当主设备故障时,用备设备替换,保证业务的高可用性。安全 VPN加密 加密连接。访问控制(ACL)允许或者拒绝访问控制规则内IP对公网或私网的访问。说明 不支持公网访问控制。设备离线锁定 防盗,长期离线锁定。运维 远程重启 通过控制台远程...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

演练场景说明

故障演练场景是演练任务的核心。AHAS提供基础资源类场景和Kubernetes类场景,帮助分布式系统提升容错性和可恢复性。每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复...

附录 灾备基本概念

第4级:电子传输及完整设备支持 完全数据备份每天一次 备份介质场外存放 每天多次定时批量传送 全部设备,可用状态(冷战)业务数据损坏 业务处理场地不可用 全部备用设备/网络故障 数小时~2天 数小时~1天 第5级:实施数据传输及完整设备...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

更新故障通告

故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 problemId Long Body 否 1312 故障Id clientToken String Body 否 4361a0e1-6747-4834-96ce-0c4840fd3812 幂等校验Id ...
< 1 2 3 4 ... 55 >
跳转至: GO

新品推荐

你可能感兴趣

热门推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折