更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

常见问题

Node.js 性能平台是如何进程故障诊断的 参见 用户指南-故障诊断。异常日志和性能日志有什么区别 异常日志是由应用写入的日志;性能日志是由运行时在设置了 ENABLE_NODE_LOG=YES(默认不写)后写入到 NODE_LOG_DIR 所指定的目录(默认/tmp)...

GBase8a数据源

GBase8a数据源为您提供读取和写入GBase8a双向通道的功能,本文为您介绍DataWorks的GBase8a数据同步的能力支持情况。使用限制 目前Gbase8a Reader和Gbase8a Writer仅支持使用 新增和使用独享数据集成资源组。insert into.:当主键或唯一性...

Vertica数据源

Vertica是一款基于列存储的MPP架构的数据库,Vertica数据源为您提供读取和写入Vertica双向通道的功能,本文为您介绍DataWorks的Vertica数据同步的能力支持情况。支持的版本 Vertica Reader通过Vertica数据库驱动访问Vertica,您需要确认...

ApsaraDB For OceanBase数据源

ApsaraDB for OceanBase数据源提供读取和写入ApsaraDB for OceanBase数据的双向功能,您可以使用ApsaraDB for OceanBase数据源配置同步任务同步数据。本文为您介绍DataWorks的ApsaraDB For Oceanbase数据同步能力支持情况。支持的版本 离线...

ClickHouse数据源

ClickHouse数据源为您提供读取和写入ClickHouse双向通道的功能,本文为您介绍DataWorks的ClickHouse数据同步的能力支持情况。支持的版本 支持阿里云ClickHouse的20.8、21.8内核版本。您需要确认驱动和您的ClickHouse服务之间的兼容能力,...

DB2数据源

说明 fetchSize 值过大(>2048)可能造成数据同步进程OOM。否 1024 Writer脚本Demo {"type":"job","version":"2.0",/版本号。steps":[{"stepType":"stream","parameter":{},"name":"Reader","category":"reader"},{"stepType":"db2",/插件...

DM(达梦)数据源

说明 fetchSize 值过大(>2048)可能造成数据同步进程OOM。否 1,024 Writer脚本Demo {"type":"job","steps":[{"stepType":"oracle","parameter":{"datasource":"aaa","column":["PROD_ID","name"],"where":"","splitPk":"","encoding":"UTF...

SQL Server数据源

SQL Server数据源为您提供读取和写入SQL Server双向通道的功能,本文为您介绍DataWorks的SQL Server数据同步的能力支持情况。支持的版本 SQL Server Reader使用驱动版本是com.microsoft.sqlserver sqljdbc4 4.0,驱动能力具体请参见 官网...

同步 OceanBase 数据库的数据至 DataHub

oms_sequence STRING 数据至同步进程内存中的时间戳,由时间+5 位递增数字组成。如果发生时钟回退的情况,会导致数据不一致。oms_record_type STRING 变更类型,包括 UPDATE、INSERT 和 DELETE。oms_is_before STRING 如果是 UPDATE 类型,...

AnalyticDB for PostgreSQL数据源

AnalyticDB for PostgreSQL数据源提供读取和写入AnalyticDB for PostgreSQL的双向功能,本文为您介绍DataWorks的AnalyticDB for PostgreSQL数据同步的能力支持情况。使用限制 离线同步支持读取视图表。支持的版本 支持版本最高至7.0(含)...

Oracle数据源

Oracle数据源为您提供读取和写入Oracle双向通道的功能,方便您后续可以通过向导模式和脚本模式配置数据同步任务。本文为您介绍DataWorks的Oracle数据同步能力支持情况。支持的版本 离线读写 版本 离线读(Oracle Reader)离线写(Oracle ...

PostgreSQL数据源

PostgreSQL数据源为您提供读取和写入PostgreSQL双向通道的功能,方便您后续可以通过向导模式和脚本模式配置数据同步任务。本文为您介绍DataWorks的PostgreSQL数据同步能力支持情况。支持的版本 目前仅支持配置PostgreSQL数据源为PostgreSQL...

MySQL数据源

Binlog至少保留72小时以上,避免任务失败后因Binlog已经消失,再启动无法重置位点到故障发生前而导致的数据丢失(此时只能使用全量离线同步来补齐数据)。检查Binlog是否开启。使用如下语句检查Binlog是否开启。SHOW variables like"log_...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者...故障复盘与改进措施 故障复盘信息同步,在故障结束后,对故障原因责任人等进行定位与定责。对故障进行复盘后,需针对此次故障件进行针对性的改进,避免后续再次发生此类故障。

基于TairString实现高性能分布式锁

分布式锁是大型应用中最常见的功能之...同时,持久内存版型实例还支持配置主备实例间同步方式为半同步,保证写入数据并同步至备节点后,才成功返回客户端(若出现备节点故障、网络异常等情况会降级为异步同步),保证高可用切换后数据不丢失。

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

节点诊断

节点Chronyd进程状态 检查节点Chronyd进程是否异常,该进程异常可能会影响系统时钟同步。节点Chronyd进程异常,可能影响节点系统时间同步。请尝试通过命令 systemctl restart chronyd 重启节点Chronyd进程。节点Containerd镜像拉取状态 ...

混合云应用双活容灾最佳实践

越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建IDC或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云厂商,另一方面还能充分利用已有的线下IDC资源。MSHA云原生多活容灾解决方案,支持混合云多活容灾产品能力...

Pod诊断

节点Chronyd进程状态 检查节点Chronyd进程是否异常,该进程异常可能会影响系统时钟同步。节点Chronyd进程异常,可能影响节点系统时间同步。请尝试通过命令 systemctl restart chronyd 重启节点Chronyd进程。节点Containerd镜像拉取状态 ...

故障应急协同

在故障发生时,第一时间(5分钟内)指定应急处理人的分工(A负责排查原因、B负责快速恢复、C负责同步进展),协调故障快速恢复,兜底同步故障进展。注意:在应急止血过程中,止血动作造成的影响不得大于故障本身的影响。

为何Pod中仍存在已恢复故障的“僵尸进程”?

在容器中,故障演练进程的父进程是PID=1的进程,容器中的一号进程不具有进程资源回收的能力,所以导致故障演练进程被终止之后,资源没有得到回收,从而成为僵尸进程。解决方案 通过手动共享PID Namespace解决该问题。在Pod的YAML文件中增加...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

ECS实例的服务进程自动关闭,如何排查?

问题原因 服务进程关闭一般有如下几种原因:系统原因。程序本身异常退出。系统中毒。操作步骤 您可以参考以下操作步骤排查问题。检查以下可能导致服务进程关闭的系统原因。ECS的云盘空间被占满。解决方法请参见 解决Linux实例磁盘空间满...

产品架构介绍

故障隔离:切零单元格内的SUB端不再进行消息的消费,从而实现消费流量的快速逃逸。消息按需消费:在消息同步的情况下每个单元有两份消息,在异地应用双活架构、异地双活单元化架构下按一定规则消费消息。定时任务,包括云消息SchedulerX和...

WAL日志并行回放

目的是让有依赖关系的任务尽量被同一个进程执行,减少进程同步的开销。如果期望优先分配的进程队列已满,或者没有相同的Task Tag在执行,则在进程组中按顺序选择一个进程,从中获取状态为 Idle 的Task Node来调度任务执行。目的是让任务...

API 引入数据概览

内容引入模块支持标准的 API 内容引入,...单击 同步详情 可查看近 7 日同步失败的内容及原因,包含 API 标识、内容原始标识、API 名称、内容形式(图文或视频)、失败原因同步时间。同步成功率:成功引入的内容量在总引入内容量中的占比。

使用DTS进行增量迁移时没有同步数据

问题原因 增量迁移没有同步数据的原因如下:目标或者源端实例运行状态异常。源或者目标实例上进程被阻塞。源实例以及目标实例负载过高。DTS任务异常(拉取不到Binlog日志等情况)。DTS链路规格较低。解决方案 说明 如果您对实例或数据有...

三个实例相互进行双向同步后出现数据缺失

例如下图所示的配置场景:可能原因 双向同步场景的关键在于防止数据回环,不适用于三个实例间的互相同步。以上图为例:DB1的数据通过DTS同步至DB2时,为防止数据回环至DB1,DTS会使用基于事务表的方式对事务进行打标,实现数据过滤。但同时...

AnalyticDB for MySQL 3.0数据源

AnalyticDB for MySQL 3.0数据源为您提供读取和写入 AnalyticDB for MySQL 3.0双向通道的功能,本文为您介绍DataWorks的AnalyticDB for MySQL 3.0数据同步的能力支持情况。...如果该值设置过大,会导致数据同步运行进程OOM异常。否 1,024

HybridDB for MySQL数据源

HybridDB for MySQL数据源为您提供读取和写入HybridDB for MySQL的双向功能,本文为您介绍DataWorks的HybridDB for MySQL数据同步能力支持情况。使用限制 离线同步支持读取视...如果该值设置过大,会导致数据同步运行进程OOM异常。否 1,024

SAP HANA数据源

SAP HANA数据源为您提供读取和写入SAP HANA双向通道的功能,本文为您介绍DataWorks的SAP HANA数据同步的能力支持情况。使用限制 离线同步支持读取视图表。目前该数据源仅支持 独...如果该值设置过大,会导致数据同步运行进程OOM异常。否 1024

MariaDB数据源

如果该值设置过大,会导致数据同步运行进程OOM异常。否 256 updateColumn 当 writeMode 配置成 update 时,发生遇到主键/唯一性索引冲突时所更新的字段。字段之间用英文逗号所分隔,例如"updateColumn":["name","age"]。否 无
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 数据库自治服务 威胁情报服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用