更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

一键诊断

相关文档 通过一键诊断了解数据库性能情况的全貌后,您可以使用如下功能对数据库进行全面细致的诊断,准确定位故障原因,并解决故障。会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是用户体验监控

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

运营阶段

通过前期的设计,到构建,服务进入日常运营环节。在这个阶段往往会产生大量的运营事件,比如日常的资源申请。企业在持续运营过程中也会产生或大或小的生产故障,需要做好线上故障管理,提升服务SLA。

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

MSE注册配置中心和自建注册配置中心对比

升级和扩缩容 免去手动配置和升级,同时运维操作过程支持无损上下线能力,避免升级、扩缩容等运维操作引起的线上故障。需要手动操作,繁杂且效率低,容易引起线上故障。高可用 多可用区部署,故障自动检测及恢复,SLA保障率高达99.95%。需...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

云盘三副本技术

重要 如果ECS实例由于病毒感染、人为误删除或黑客入侵等软故障原因造成数据丢失,需要您采用备份或者快照等技术手段来解决。任何技术都不可能解决全部问题,因地制宜地选择合适的数据保护措施,才能为您的业务数据筑起一道坚实的防线。更多...

VPC NAT网关配合物理专线实现本地IDC与云互访

配置项 地址段 云上VPC1网段 192.168.0.0/16 云上交换机网段 VSW1:192.168.10.0/24 VSW2:192.168.20.0/24 NATVSW:192.168.3.0/24 云上ECS实例的IP地址 ECS1:192.168.10.55 ECS2:192.168.20.30 本地IDC网段 172.16.0.0/12 本地IDC中...

VPC NAT网关联动VPN网关实现云与云下私网互访

配置项 地址段 云上VPC1网段 10.0.0.0/16 云上交换机网段 VSW1:10.0.0.0/24 VSW2:10.0.1.0/24 云上ECS实例的IP地址 ECS1:10.0.0.81 本地IDC网段 172.16.0.0/12 本地IDC内服务器IP地址 172.16.0.124 本地IDC网关设备IP地址 211.68.XX.XX ...

流量回放和压测

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库复现故障场景,定位故障原因。注意事项 为减少网络延迟对压测的影响,压测客户端和目标实例需要在同一个地域。说明 建议将压测客户端和目标实例放入同一个...

智能压测

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库复现故障场景,定位故障原因。注意事项 为减少网络延迟对压测的影响,压测客户端和目标实例需要在同一个地域。说明 建议将压测客户端和目标实例放入同一个...

DTS通过物理专线访问本地IDC数据库

前提条件 您已经在华北2(北京)地域创建了VPC,在北京可用区H和可用区G各创建了一台交换机(分别为交换机1和交换机2),且在交换机1和交换机2内购买了RDS实例。本文以在交换机中创建RDS MySQL 8.0版本实例为例说明。具体操作,请参见:...

IPsec-VPN联合物理专线实现主备链路上云(绑定VPN网关...

本文为您介绍如何组合使用IPsec-VPN和物理专线,实现本地数据中心IDC(Internet Data Center)通过主备链路上云并和云专有网络VPC(Virtual Private Cloud)互通。场景说明 本文以下图场景为例,为您介绍IPsec-VPN联合物理专线实现主备链...

支持计划

与阿里云相关的财务及账号合同问题的咨询支持 与阿里云产品相关的部分第三方软件配置指导以及故障排查(见附录支持列表)阿里云支持计划服务范围不包含:云业务操作及代运维服务 业务代码开发 不在附录列表的第三方软件配置指导以及故障...

专线连接类

排查物理专线故障原因,具体操作,请参见 故障排查。本地数据中心到阿里云的线路中断,如何解决?请在本地数据中心的网关设备测试物理专线的客户端侧IP到阿里云侧IP是否可达,即此物理专线的直连IP是否可以ping通。如果不通,则需您向...

设备显示离线

可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果不正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否电。电源状态...

以太网接口无法接通

本文介绍以太网接口没有接通的可能原因和处理方法。问题现象 以太网接口没有接通(物理)。可能原因 设备没有连接电源或者以太网接口连接的线缆没有插好。光纤、双绞线过长或者链路损耗太大。接口、接口模块或者设备故障。解决方案 检查...

网络规划

您可以根据以下两点规划交换机:使用一个VPC时,也请尽量使用至少两个交换机,并且将两个交换机分布在不同可用区,这样当其中一个可用区的交换机发生故障时,可以切换到另一个可用区的交换机,从而实现跨可用区容灾。同一地域不同可用区...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

网络不通畅导致网站无法正常访问

本文主要介绍由于您本地到网站所在服务器中间的网络不通畅导致网站无法正常访问的解决方案...根据数据包在网络的停止位置,判断故障位置并自行解决网络问题。说明 如果您的网络异常情况自己仍无法解决,请您 提交工单 联系阿里云技术支持。

以太网接口频繁Up/Down

本文介绍以太网接口频繁Up/Down的原因和处理方法。问题现象 以太网接口频繁Up/Down。可能原因 线缆没有连接好。双绞线过长、光纤超长或链路损耗太大。接口、接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备...

创建节点池

托管节点池:在普通节点池基础,提供CVE自动修复、自动触发故障节点修复等能力,从而实现托管的自动化节点运维。更多信息,请参见 托管节点池概述。说明 仅ACK Pro集群支持托管节点池。两种节点池的差异,请参见 托管节点池与普通节点池...

创建Kubernetes托管版集群

勾选 故障时重启节点 后,节点NotReady时,系统会尝试自动重启相关组件来修复故障节点,并在重启前执行排水。自动升级规则 选中 托管节点池 后,可设置此配置项。勾选 自动升级 kubelet 后,系统会在有可用的kubelet版本时自动升级到该版本...

集群高可用架构推荐配置

合理部署Nginx Ingress Controller 在部署Nginx Ingress Controller时,请确保Nginx Ingress Controller分布在不同的节点,避免不同Nginx Ingress Controller之间资源的抢占和单点故障。您也可以为其使用独占节点来保证性能与稳定性,...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

步骤1:创建实例

Redis集群实例的分片数,数据将分布在该集群的各个分片。节点类型 架构类型 选择为 集群版 或 标准版 时,可选择为下述节点类型:双副本:一主一从共两个节点,双机热备架构,数据持久化保存。说明 当选择 双可用区 或 企业版(Tair)时...

GxP欧盟附录11标准合规包

GxP欧盟附录11标准合规包基于GxP欧盟附录11对账号数据保护的基线标准,从云资源使用和管控方面提供部分建议的合规性检测。关于GxP欧盟附录11合规标准的更多信息,请参见 GxP EU Annex 11。应用场景 GxP欧盟附录11标准合规包应用于制药、...

容器网络FAQ

问题原因 Pod IP所属的虚拟交换机不具备公网访问的能力。解决方法 您可以通过NAT网关的SNAT功能,为Pod IP所属的虚拟交换机配置公网SNAT规则。更多信息,请参见 为已有集群开启公网访问能力。手动升级了Flannel镜像版本后,如何解决无法...

配置网络

交换机所在的子网故障或子网中的IP地址已用尽,您可以在配置VPC时提供两个或者多个交换机ID,如果一个可用区出现故障,您的函数可以在其他可用区运行,提高容错能力。安全组配置错误,请您按照以下要求配置安全组。需要设置VPC中的安全组的...

创建RDS SQL Server实例

如何选择交换机 选择已有的交换机或单击 创建交换机 新建。参数配置说明,请参见 创建和管理交换机。如何选择部署方案 多可用区部署(推荐):主节点和备节点位于同一地域的不同可用区,具备跨可用区容灾。如果 部署方案 选择 多可用区部署...

Mesh 常见问题

XDS 配置不下发 问题原因:Pilot 未启动或 Pilot 与 MOSN 网络不通。解决方案:查看 MOSN 连接 Pilot 是否正常。进入 MOSN 容器,执行如下命令,如果和pilot没有链接则检查pilot的地址是否填写正确 netstat-na|grep 15050 进到MOSN容器,在...

节点诊断

重要 使用故障诊断功能时,系统将在您的集群节点执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常...

Pod诊断

重要 使用故障诊断功能时,系统将在您的集群 节点 执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的...
共有183条 < 1 2 3 4 ... 183 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用