DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

管理SQL Server集群

主机故障处理策略 主机发生故障时系统的处理策略。说明 由于SQL Server主机存储类型暂不支持本地盘,手动替换主机功能暂不可用。目前请选择自动替换主机故障处理策略。资源分配策略 专属集群数据库实例的默认分配策略:均衡分配:最大化...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击确认。单击关于,进入关于系统页面。找到日志信息区域,单击下载...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。操作步骤 在浏览器中,输入https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击确认。单击关于,进入关于系统页面。找到日志信息区域,单击...

替换主机

当主机发生故障后,如果您创建专属集群MyBase时主机故障处理策略选择的是手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会通过...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

替换主机

当主机发生故障后,如果您创建专属集群MyBase时主机故障处理策略选择的是手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会通过...

JVM注入动态脚本

受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也可代表每次请求发生故障的概率。填写小于或等于0,则表示100% 发生故障。说明 仅填写百分比数字部分即可,即80%,填写80。请求过滤规则 否 无 通过...

修改DDH故障迁移配置

若您未开启DDH故障迁移服务,DDH发生故障停机后,您需要提交工单申请置换一台健康的DDH。注意 本地SSD型DDH(例如本地SSD型i2)不支持自行手动迁移和故障时自动迁移。如果本地SSD型DDH出现故障,您可以提交工单申请人工迁移,但迁移后本地...

同城容灾 解决方案架构

当主用机房的数据库发生故障时,业务切换至备用机房的数据库。A-S模式:同城两机房中部署完全一致的系统,其中一个机房(Standby)的资源完全用于备份,不对外提供业务。当主用机房(Active)发生故障时,业务切换至备用机房。A-A模式:...

应急预案:专有云V3环境中AnalyticDB相关机器故障紧急...

1.概述 本文主要介绍在专有云V3环境中,AnalyticDB相关机器故障紧急维修...在专有云V3环境AnalyticDB相关机器发生故障,需要进行下线维修。3.解决方案 详情请参见以下KB文档。KB 123746 通用方案:专有云V3环境中AnalyticDB机器的RMA处理流程
来自: 首页

管理集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专属...

管理集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专属...

网关一体机告警介绍

本文介绍网关一体机中磁盘故障、电源故障等硬件告警,以及CPU使用、内存使用等软件告警信息。监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用 一分钟内平均使用超过95%客户邮箱 是 每日最多5封 是 内存使用 一...

管理PostgreSQL集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专属...

管理MySQL集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase基本信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专...

容灾恢复

集群中通常一个服务有多个服务提供者,其中部分服务提供者可能由于网络、配置、长时间 fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能会将这部分异常的服务提供...更多信息,请参见 自动故障剔除。

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。...

DDH故障迁移

若您未开启DDH故障迁移服务,DDH发生故障停机后,您需要提交工单申请置换一台健康的DDH。注意 DDH因故障迁移完成后,DDH ID及ECS实例的元数据(例如实例ID、私有IP地址、公网IP地址)均保持不变,但是由于更换了物理服务器,DDH的机器码会...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在故障详情页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障通告...

应急预案:OSS物理机关机维修和系统重新克隆的方法

OSS物理机发生故障,每次只能下线一台,请合理安排窗口期。在机器下线过程中,需要对盘古ChunkServer上的数据做备份,请预留出足够的时间做变更。如果KV_Master不为3台或者5台,或者Checkready检查异常,需要联系阿里云技术支持获取帮助。...
来自: 首页

车联网实时监控方案

计算编排和存储:基于车辆上报信息,基于区域、车辆类型、企业等维度实时统计在线故障率,并按照自定义聚合维度以列式格式存储结果。数据透出:通过数据API对下游输出数据。下游EDAS应用通过API调用数据,并通过用户自身应用对外展示和...

备份和灾难恢复

故障切换回切:通过DNS将应用IP从原生产中心修改到灾备中心,实现故障切换和服务恢复机制主站发生故障时,由备站继续提供服务。3.两地三中心 业务部署模式:目前相同的业务应用可以分别部署在阿里云两个城市的三个数据中心中(杭州两个机房...

故障演练快速入门

为验证系统的容错性和可恢复性等性能,您可以将合适的故障注入到系统中,观察系统的表现,从而识别系统中可能存在的问题并及时修复。本文以 CPU 满载演练为例,介绍如何使用故障演练功能。步骤一:安装探针 进入 AHAS 产品主页,开通 AHAS ...

故障隔离

某个服务故障或者异常时,如果该服务触发熔断会造成整个服务的不可用。而故障隔离能够定位到异常的服务实例,实现实例级别精细化的隔离和摘流,使故障影响的范围更小、更可控。配置故障隔离规则登录 SOFAStack 控制台。在左侧菜单栏选择 ...

混沌工程缓存实战系列-Redis

借助混沌工程可以了解到问题发生时对系统、业务的影响面是否符合预期。梳理演练场景 对于示例应用,可以按照以下思路来梳理演练场景:明确缓存监控的指标。分析影响这些指标可能的因素、故障场景、参数等。因为客户端层面的影响面可控,...

混沌工程缓存实战系列-Redis

借助混沌工程可以了解到问题发生时对系统、业务的影响面是否符合预期。梳理演练场景 对于示例应用,可以按照以下思路来梳理演练场景:明确缓存监控的指标。分析影响这些指标可能的因素、故障场景、参数等。因为客户端层面的影响面可控,...

概览

事件概览 事件概览为您汇总最近24小时发生故障和运维事件。目前支持以下云服务的重要事件。云服务 事件名称 主机 插件停止 云数据库RDS版 主备切换 云数据库RDS版 实例故障 云数据库MongoDB版 实例故障 云数据库Redis版 主备切换 云数据...

自动故障剔除

自动故障剔除功能会自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

应用场景

当其中一部分ECS实例发生故障后,负载均衡会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾) 为了提供更加稳定可靠的负载均衡服务,阿里云负载均衡已在各地域部署了多可用区以...

自动/手动主备切换

当系统发生故障时,PolarDB集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。自动主备切换 PolarDB集群版采用双活(Active-Active)的高可用集群架构。当系统发生故障时,可读写的主节点和只读节点之间会...

管理MongoDB集群

背景信息 关于专属集群MyBase的更多介绍,请参见什么是云数据库专属集群MyBase。查看专属集群MyBase信息 登录云数据库专属集群控制台。在页面左上角,选择目标地域。在集群列表页,查看专属集群信息,或者将信息下载到本地。默认展示专属...

链路状态

发生故障时,及时进行切换。操作步骤 登录智能接入网关控制台。在智能接入网关页面,单击目标实例ID。在智能接入网关实例详情页面,单击高可用配置,可查看链路状态。绿灯:表示链路正常。红灯:表示链路故障。icmsDocProps={'...

数据库灾备解决方案

当用户本地已部署有数据库及存储设备,可通过云上存储做本地数据库的数据备份,当本地数据库发生故障时可通过云上存储将数据恢复到本地。解决方案架构示例如下:架构设计说明: 关键部件部署:在用户本地部署有两套数据库:生产数据库和...

跨地域容灾

容灾系统部署在阿里云上两个地域中,当主系统发生故障时,业务系统切换到容灾系统。主系统和容灾系统部署在不同的地域,可靠性更高,有效避免了地域性灾害导致的系统故障。准备工作 在实现跨地域容灾之前,您需要选择一个不同于生产环境的...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障,开发者就可以通过服务器推送开关,及时将故障代码关闭。这种推拉结合的方式,即时到达 100%。发布H5离线包更新如果某些故障是发生在离线包内,在定位到问题后,可以直接通过实时发布控制台发布新的版本即可。...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当主系统发生故障时,业务系统切换到容灾系统。主系统和容灾系统部署在不同的地域,提供容灾即服务,且RPO可以低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障...

如何排查Java场景下故障注入不生效的问题

为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,您需要先确认该演练的故障执行步骤是否已开启Debug模式。若...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO

新品推荐

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折

你可能感兴趣

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化

热门推荐

切换为移动版

新人福利专场 阿里云试用中心 企业支持计划 飞天会员助力企业低成本上云 智能财税30天免费试用 云解析DNS新用户首购低至36元/年起 ECS限时升级特惠6.5折