更新故障复盘改进详情

String Body 否 故障原因A 故障原因 recentActivity String Body 否 2 最近活动 码表:PROBLEM_RECENT_ACTIVITY injectionMode String Body 否 1 注入方式 码表:PROBLEM_INJECTION_MODE recoveryMode String Body 否 2 恢复方式 码表:...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请提工单联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用ping {mse.nacos.host}指令尝试解析。如果提示unknown host,则无法解析域名。如果提示PING${mse.nacos.host} (xxx.xx.xx.xx)56(84)bytes of ...

CreateCustomizedFilter

目前仅支持WRITE,表示手写输入。ValueCompareType String 是 NUMBER 值的比较类型。取值: NUMBER:按数字比较 STRING:按字符串比较 BlackWhiteType String 是 BLACK 比较的黑白名单类型:BLACK:黑名单 WHITE:白名单 Value String 是 1...

诊断网页加载过慢的问题

慢加载详情页面顶部的页面信息区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情页面的页面资源加载瀑布图区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载详情...

自定义过滤条件

过滤条件值类型:目前只支持手写输入,即直接输入过滤条件值。过滤条件校验方式:即如何使用过滤条件值,是通过字符串比较的方式还是数字比较的方式。字符串比较即从字符串第一个字符开始逐个比较。黑白名单:设为黑名单则不符合条件的设备...

DescribeCustomizedFilter

过滤条件值 ValueType String WRITE 过滤条件的输入类型,目前仅支持WRITE,表示手写输入。GmtCreate String 2018-01-01 00:00:00 创建时间 GmtModify String 2018-01-01 00:01:00 修改时间 示例 请求示例 http(s):/iovcc....

OEE

获得授权的第三方工业应用也可以通过接口设置设备状态,接口文档参看设置OEE设备在指定时间段内的状态,包括故障原因描述,开始及结束时间。获得设备综合效率计算结果 OEE应用实时计算设备综合效率的结果,可以通过设置获得设备综合效率...

故障复盘改进详情

Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 recentActivity String 2 最近活动 码表:PROBLEM_RECENT_ACTIVITY injectionMode String 3 注入方式 码表:PROBLEM_INJECTION_MODE recoveryMode ...

什么是故障

包括根检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

使用Kubernetes事件中心监控GPU异常

GPU设备在使用中,容易发生一些Xid错误,可以配合Kubernetes事件中心,对这些Xid错误进行监控告警,及时发现并定位故障原因。操作步骤 进入日志服务K8s事件中心页面。具体操作步骤,请参见创建并使用Kubernetes事件中心。在K8s事件中心左侧...

设置OEE设备在指定时间段内的状态,包括故障原因描述...

设备轴承故障,正在检修 故障原因描述(如果是故障停机,可选),非必填,在发生设备故障时可填 beginDateTime String 是 2019-06-18 18:00:00 开始时间,格式为yyyy-MM-dd HH:mm:ss or yyyy-MM-dd HH:mm 或者毫秒时间戳 endDateTime ...

查看应用事件

输入事件原因,例如Pod的FailedScheduling。事件等级 包括全部、警告和正常。重要 请重点关注警告级别的事件并检查您的应用。更多信息 查看应用事件后,您可以根据具体的事件信息以及业务需求采取相应的操作,详情请参见以下相关文档:负载...

查看ECS实例的操作记录

如果您在使用ECS实例的过程中遇到故障,可以通过查看ECS实例的操作记录识别可能的故障原因。背景信息 操作记录以ECS实例为入口,对实例及其关联资源的所有操作进行操作审计,并且对操作记录的影响等级进行标注,在众多操作记录中高亮出可能...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示: 源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

云盘三副本技术

如果ECS实例由于病毒感染、人为误删除或黑客入侵等软故障原因造成数据丢失,需要您采用备份或者快照等技术手段来解决。任何技术都不可能解决全部问题,因地制宜地选择合适的数据保护措施,才能为您的业务数据筑起一道坚实的防线。更多有关...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件:当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为修复失败状态。说明 如果一个节点池中存在多个异常节点,...

背景信息以及准备工作

DLA可以在不移动OSS日志文件的情况下读取并分析日志文件数据,定位服务故障原因等。对于一个服务而言,日志文件记录了服务运行的所有详细信息。在进行故障排除、状态监控或者预测告警时,都需要对日志文件进行查询分析。阿里云对象存储服务...

容器服务ACK集群故障排查

下表罗列了一部分ACK集群常见的故障原因以及处理方法:故障场景 处理方法 API Server组件停止或Master组件停止: 不能创建(停止、更新)Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常工作,除非该Pod或Service需要调用...

操作步骤

步骤三:读取日志文件数据 表创建成功后,您可以在DLA中通过SELECT查询并分析OSS日志文件数据,帮助定位故障原因。log4j_sample.log SELECT*FROM oss_log_schema.log4j_log ngnix_log SELECT*FROM oss_log_schema.ngnix_log webserver_log ...

元数据管理

新增元数据 除了默认提供的元数据,例如需要建立设备故障知识库,定义故障原因元数据,这类主数据就可以在设备运维、质量分析和生产排产等应用中使用。单击新增元数据。在元数据列表页面设置元数据相关信息。设置项 描述 元数据名称 元数据...

修改配置信息

EMR Serverless提供通过控制台的方式...在弹出的对话框中,输入原因说明,单击确定。提交配置修改请求后,如果修改的配置项在修改后需要重启,则会在修改完配置后重启实例,实例会进入升级中的状态,且在操作历史中会增加一条配置修改记录。

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

专线连接类

排查物理专线故障原因,具体操作,请参见故障排查。本地数据中心到阿里云的线路中断,如何解决?请在本地数据中心的网关设备上测试物理专线的客户端侧IP到阿里云侧IP是否可达,即此物理专线的直连IP是否可以ping通。如果不通,则需您向运营...

导出数据

选择是否跳过校验,如果跳过校验请务必输入原因。相关人 设置的相关人员可查看工单,并协同工作,非相关人员则不能查看工单(管理员、DBA除外)。导出SQL语句 输入导出SQL语句。工单附件 您可以上传图片、文档格式的文件来补充当前工单信息...

Dataphin集成任务运行报错:"PSQLException:ERROR:...

问题描述 Dataphin集成任务运行报错:"PSQLException:ERROR:value too long for ...问题原因 输入字段的数据太长超过输出字段设置的最大长度导致的。解决方案 在输出语句中添加准备语句,修改字段的字符串长度即可。适用于 Dataphin 公共云

Dataphin管道任务运行失败,提示“分区配置错误”

问题描述 Dataphin管道任务运行失败,提示“分区配置...问题原因 输入配置中分区配置异常,成了ds。解决方案 分区配置需填写具体分区,如需导入多分区,建议分任务执行。适用于 Dataphin 说明:本文适用于公共云v2.9.4-3版本数据集成模块。

RPC 常见问题

is10.160.34.141:12200您可以通过如下步骤进行排查:查看是否服务本身问题导致的超时,如业务代码处理时间过长。默认情况下,RPC 的超时时间为 3 秒。要确定某个请求的实际处理时间,您可登录服务端查看 logs/tracelog/rpc-server-digest...

上传证书失败FAQ

可能有以下两个方面的原因输入的公钥内容错误。系统不支持您的证书使用的编码格式。解决方案 对于公钥内容错误,需要将证书上传到Linux服务器,运行以下命令进行内容自检:openssl x509-noout-text-in myprivate.pem 当出现下图中的报错...

申请表权限

申请原因 输入申请目标表权限的原因。单击申请权限,提交申请。您可以在权限申请记录页签,查看当前申请的审批详情及审批记录。通过旧版安全中心申请表权限 在表详情页面,单击申请权限,默认进入新版安全中心的权限申请页面。您可以单击...

查询与分析日志的常见报错

line 1:9:extraneous input‘’expecting 报错原因 输入了多余的中文引号。解决方法 检查及修改查询和分析语句,然后重新执行。key(XXX)is not config as key value config,if symbol is in your log,please wrap:with quotation mark"报错...

DLF数据访问权限控制

申请原因 输入申请目标表权限的原因。单击申请权限,提交申请。您可以在权限申请记录页签,查看当前申请的审批详情及审批记录。权限审批 说明 RAM用户(子账号)需要具备Admin(数据湖管理员)或super_administrator(超级管理员)的权限,...

MaxCompute数据访问权限控制

申请原因 输入申请目标表权限的原因。单击申请权限,提交申请。您可以在权限申请记录页签,查看当前申请的审批详情及审批记录。权限审批 查看待审批的申请。进入权限审批页面,您可以根据申请账号、申请时间、工作空间、项目名称、对象名称...

附录:强制重跑下游

输入需要进行强制重跑下游的原因。单击确定,系统将根据您的设置,将选中节点的状态全部置为未运行,并重新开始调度。场景示例 场景描述:假设对A节点发起强制重跑下游的操作,选择重跑A工作空间,不重跑B工作空间的节点。运行详情:B工作...

管理配置项

在弹出的对话框中,输入执行原因,打开自动配置更新开关,单击保存。生效配置。请根据您修改的参数类型执行以下操作,使修改的配置生效。客户端类型配置 如果修改的参数类型为客户端类型配置,修改完成后,单击部署客户端配置。在弹出的...

管理配置项

在弹出的对话框中,输入执行原因,开启自动配置更新,单击保存。部署配置。单击部署客户端配置。在弹出的对话框中,输入执行原因,单击确定。在确认对话框中,单击确定。说明 Spark集群中的配置是作为Spark提交作业的默认参数使用,会被您...

使用LDAP认证

在弹出的对话中,输入执行原因,单击确定。在确认对话中,单击确定。重启HiveServer。在组件列表区域,选择HiveServer操作列的>重启。在弹出的对话中,输入执行原因,单击确定。在确认对话中,单击确定。连接HiveServer。开启LDAP认证后,...

管理组件参数

在确认修改对话框中,输入执行原因,开启自动更新配置。单击确定。生效配置。请根据您修改的参数类型执行以下操作,使修改的配置生效。客户端类型配置 如果修改的参数类型为客户端类型配置,修改完成后,在配置页面,单击部署客户端配置。...

管理LDAP认证

在弹出的对话中,输入执行原因,单击确定。在确认对话中,单击确定。重启SparkThriftServer。在组件列表区域,选择SparkThriftServer操作列的>重启。在弹出的对话中,输入执行原因,单击确定。在确认对话中,单击确定。连接Spark ...

JindoTable表或分区访问热度收集

在确认修改对话框中,输入执行原因,开启自动更新配置。单击确定。重启服务。在Hive服务页面,选择右上角的操作> 重启HiveServer2。在执行集群操作对话框,输入执行原因。单击确定。在确认对话框中,单击确定。关闭热度收集 登录阿里云E-...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用