更新故障复盘改进详情

String Body 否 故障原因A 故障原因 recentActivity String Body 否 2 最近活动 码表:PROBLEM_RECENT_ACTIVITY injectionMode String Body 否 1 注入方式 码表:PROBLEM_INJECTION_MODE recoveryMode String Body 否 2 恢复方式 码表:...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请提工单联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用ping {mse.nacos.host}指令尝试解析。如果提示unknown host,则无法解析域名。如果提示PING${mse.nacos.host} (xxx.xx.xx.xx)56(84)bytes of ...

诊断网页加载过慢的问题

慢加载详情页面顶部的页面信息区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情页面的页面资源加载瀑布图区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载详情...

OEE

获得授权的第三方工业应用也可以通过接口设置设备状态,接口文档参看设置OEE设备在指定时间内的状态,包括故障原因描述,开始及结束时间。获得设备综合效率计算结果 OEE应用实时计算设备综合效率的结果,可以通过设置获得设备综合效率...

故障复盘改进详情

Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 recentActivity String 2 最近活动 码表:PROBLEM_RECENT_ACTIVITY injectionMode String 3 注入方式 码表:PROBLEM_INJECTION_MODE recoveryMode ...

使用Kubernetes事件中心监控GPU异常

GPU设备在使用中,容易发生一些Xid错误,可以配合Kubernetes事件中心,对这些Xid错误进行监控告警,及时发现并定位故障原因。操作步骤 进入日志服务K8s事件中心页面。具体操作步骤,请参见创建并使用Kubernetes事件中心。在K8s事件中心左侧...

什么是故障

包括根检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

设置OEE设备在指定时间内的状态,包括故障原因描述...

设置OEE设备在指定时间内的状态,包括故障原因描述,开始及结束时间。路径/industry/oee/equipment/status/set 版本号 1.0.1 协议 HTTPS 请求方法 POST 是否需要用户身份鉴权 可选 超时时间 5000 请求参数 名称 类型 是否必选 示例值 ...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考创建地址池 文档。注意: 如未设置备用地址...

如何管理故障

可对故障根进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等 关联故障期间的故障变更,新增故障改进措施等操作。故障状态处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做恢复操作后是已...

查看ECS实例的操作记录

如果您在使用ECS实例的过程中遇到故障,可以通过查看ECS实例的操作记录识别可能的故障原因。背景信息 操作记录以ECS实例为入口,对实例及其关联资源的所有操作进行操作审计,并且对操作记录的影响等级进行标注,在众多操作记录中高亮出可能...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

通过集群检查功能定位集群问题

本文介绍如何通过容器服务提供的集群检查功能快速定位...故障诊断:若通过集群检查的检查报告无法定位节点、Pod及网络的具体故障原因,建议您通过集群故障诊断功能进行故障的诊断修复。具体操作,请参见通过集群故障诊断功能定位集群问题。

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示: 源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

云盘三副本技术

如果ECS实例由于病毒感染、人为误删除或黑客入侵等软故障原因造成数据丢失,需要您采用备份或者快照等技术手段来解决。任何技术都不可能解决全部问题,因地制宜地选择合适的数据保护措施,才能为您的业务数据筑起一道坚实的防线。更多有关...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件:当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为修复失败状态。说明 如果一个节点池中存在多个异常节点,...

元数据配置

除了默认提供的元数据,也可以根据企业情况创建元数据,例如需要建立设备故障知识库,定义故障原因元数据,这类主数据就可以在设备运维、质量分析和生产排产等应用中使用。首先单击“新建元数据”。在弹出的页面中输入元数据名称和描述,...

背景信息以及准备工作

DLA可以在不移动OSS日志文件的情况下读取并分析日志文件数据,定位服务故障原因等。对于一个服务而言,日志文件记录了服务运行的所有详细信息。在进行故障排除、状态监控或者预测告警时,都需要对日志文件进行查询分析。阿里云对象存储服务...

管理部署环境

当部署环境运行状态异常时,在部署环境页面概览右上角单击重建可以重新构建环境,应用的部署环境内的所有资源都将重新构建,从而恢复环境的异常功能,同时可能排查出故障原因。释放环境 在部署环境概览页面右上角单击释放,可以释放或解绑...

容器服务ACK集群故障排查

下表罗列了一部分ACK集群常见的故障原因以及处理方法:故障场景 处理方法 API Server组件停止或Master组件停止: 不能创建(停止、更新)Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常工作,除非该Pod或Service需要调用...

查看监控指标

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

OEE

设置设备故障停机(可选)如果设备物模型能够准确识别设备停机是有用设备故障造成,可设置设备故障原因,首先选择物联设备属性,然后填写属性表达式和值。如果设备物模型能够采集到设备故障的编码或者描述,可以选择设备故障原因对应的物...

操作步骤

步骤三:读取日志文件数据 表创建成功后,您可以在DLA中通过SELECT查询并分析OSS日志文件数据,帮助定位故障原因。log4j_sample.log SELECT*FROM oss_log_schema.log4j_log ngnix_log SELECT*FROM oss_log_schema.ngnix_log webserver_log ...

元数据管理

新增元数据 除了默认提供的元数据,例如需要建立设备故障知识库,定义故障原因元数据,这类主数据就可以在设备运维、质量分析和生产排产等应用中使用。单击新增元数据。在元数据列表页面设置元数据相关信息。设置项 描述 元数据名称 元数据...

智能压测

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。注意事项 为减少网络延迟对压测的影响,压测客户端和目标实例需要在同一个地域。说明 建议将压测客户端和目标实例放入同一个...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

专线连接类

排查物理专线故障原因,具体操作,请参见故障排查。本地数据中心到阿里云的线路中断,如何解决?请在本地数据中心的网关设备上测试物理专线的客户端侧IP到阿里云侧IP是否可达,即此物理专线的直连IP是否可以ping通。如果不通,则需您向运营...

新增自定义功能

例如:将已定义的属性电压作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set、...

单个添加物模型

例如:将已定义的属性电压作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set、...

RPC 常见问题

如果发生 RPC 线程池队列阻塞,先确认是否发生超时的时间有业务请求高峰,或者用 jstack 查看业务线程是否有等待或者死锁情况,导致 RPC 线程耗尽。更多信息,请参见 应用维度配置扩展。查看是否 GC 问题(Garbage Collection,简称 GC...

光模块故障

介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号详情请参见光模块型号。说明 目前仅SAG-1000支持光模块插入。解决方案 通用多模光...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生、故障发现、故障通告、业务响应、初定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘按钮:故障恢复后,需进行故障...

Tair客户端重连指南

引发暂时性故障原因 原因 说明 故障触发了高可用机制 云原生内存数据库Tair支持节点健康状态监测,当监测到实例中的主节点不可用时,会自动触发主备切换,例如将主节点和从节点进行互换,保障实例的高可用性。此时,客户端可能会遇到下列...

Redis客户端重连指南

引发暂时性故障原因 原因 说明 故障触发了高可用机制 云数据库Redis支持节点健康状态监测,当监测到实例中的主节点不可用时,会自动触发主备切换,例如将主节点和从节点进行互换,保障实例的高可用性。此时,客户端可能会遇到下列暂时性...

泛化协议设备接入相关问题

由于网络故障原因导致的异常断开,SDK会自动发起重连。如何批量生成设备证书?您可以直接使用物联网平台提供的SDK来调用API BatchRegisterDevice,批量生成设备证书。更多信息,请参见下载云端SDK和BatchRegisterDevice。如何获取子设备...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

Control Center设置告警

暂停和恢复所有警报操作出于维护或故障排除原因,必要时暂停所有启用的警报。在暂停和恢复期间会遵守启用或禁用的单个操作的现有设置。暂停时会忽略满足和触发的任何触发条件,并抑制与触发器关联的所有已启用操作。准备好后,再次恢复警报...

Android 5.X 手机证书过期的问题

GMT+08:00 2021(compared to Wed Jan 12 10:12:30 GMT+08:00 2022)\"",问题原因故障为 Android 5.x 手机系统问题,解决办法是信任所有证书。解决方法在客户端设置 TinyAppRequestPluginProvider。H5Utils.setProvider...
共有83条 < 1 2 3 4 ... 83 >
跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用