ack-node-problem-detector是ACK基于社区开源项目进行改造和增强的集群节点异常事件监控组件,同时支持对接第三方监控平台,承载ACK集群的节点异常发现以及事件中心的功能。您可以根据需求使用该组件加入定制化的节点监控插件,扩大节点...
为了提升集群的稳定性,建议您将ACK NPD(ack-node-problem-detector)组件升级到1.2.8版本以上。背景信息 低于v1.2.8版本的ack-node-problem-detector组件会默认开启文件系统句柄巡检项(check_fd),check_fd的进程在读取大内核数据时,...
PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 返回数据 名称 类型 示例值 描述 requestId ...
Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:...
PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE: 故障补发 PROBLEM_CANCEL:故障取消 clientToken String Body 否 FD200FAE-E98F-496E-BFE6-4CE61E59A2EF 幂等校验 返回数据 名称 类型 ...
PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 problemId Long Body 否 1312 故障Id clientToken String Body 否 4361a0e1-6747-4834-96ce-0c4840fd3812 幂等校验Id 返回数据 名称 类型 示例值 描述 ...
PROBLEM_UPGRADE 撤销 PROBLEM_REVOKE 恢复 PROBLEM_RESTORE 复盘 PROBLEM_IN_REVIEW 完结 PROBLEM_REOPENED 取消 PROBLEM_CANCEL 更新故障通告 PROBLEM_UPDATE_NOTIFY 添加故障小计 PROBLEM_ADD_SUBTOTAL 更新故障 PROBLEM_UPDATE ...
PROBLEM_CANCEL 升级 PROBLEM_UPGRADE 撤销 PROBLEM_REVOKE 恢复 PROBLEM_RESTORE 复盘 PROBLEM_IN_REVIEW 完结 PROBLEM_REOPENED 取消 PROBLEM_CANCEL 更新故障通告 PROBLEM_UPDATE_NOTIFY 添加故障小计 PROBLEM_ADD_SUBTOTAL 更新故障 ...
故障影响服务详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
PROBLEM_DEGRADE 故障降级 PROBLEM_RECOVER 故障恢复 PROBLEM_REISSUE 故障补发 PROBLEM_CANCEL 故障取消 USERNAME 人员姓名 PHONE 人员手机号 RAM_ID RAM账号ID ASSIGNED 已分派 RESPONDED 已响应 FINISHED 已完结 JSON 格式 ...
PROBLEM_REASON 父配置Code configKey String 2 配置key项 configValue String 产品设计 配置key对应的value值 requirement Boolean true 是否必选 requestId String uuid requestId 示例 请求示例 POST/config/all ...
通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 problemLevel String Body 否 P2 ...
最近活动码表:PROBLEM_RECENT_ACTIVITY injectionMode String Body 否 1 注入方式码表:PROBLEM_INJECTION_MODE recoveryMode String Body 否 2 恢复方式码表:PROBLEM_RECOVERY_MODE discoverSource Long Body 否 1 发现来源码表:...
problem/38b2a7893-484d-8989-b9cf-d243e53a82c6 keys problemId String Body 否 50002021 故障id 返回数据 名称 类型 示例值 描述 requestId String c26f36de-1ec8-496a-a828-88067879ef81 requestId data Object data links Array of ...
安装node-problem-detector并创建事件中心 或在集群 组件管理 中一键安装 ack-node-problem-detector 组件时的默认开启检查项。从 应用目录 中安装 ack-node-problem-detector 组件时还需要手动开启检查项。在 参数配置 向导页面,单击 ...
发现来源码表:PROBLEM_DISCOVER_SOURCE userReport Long 1 用户上报码表:PROBLEM_USER_REPORT monitorSourceName String Zabbix 监控源 relationChanges String 关联变更 关联变更 dutyUserId Long 231 故障责任人id replayDutyUserId ...
PROBLEM_INJECTION,PROBLEM_HAPPEN 关键节点 码表:PROBLEM_KEY_NODE(逗号分隔)content String 内容 内容 isKey Boolean true 是否是关键字 true是 false不是 默认 false updateTime String 2020-08-08 15:38:38 修改时间 time String 2020-...
keyNode String Body 否 NodeTest 关键节点码表:PROBLEM_KEY_NODE content String Body 否 故障分析 节点内容 time String Body 否 2021-01-08 10:10:10 发生时间 problemId Long Body 否 234 故障id clientToken String Body 否 c26f36de...
Body 否 PROBLEM_KEY_NODE 关键节点码表:PROBLEM_KEY_NODE content String Body 否 时间线内容XXXX 节点内容 time String Body 否 2021-06-06 12:11:22 发生时间 clientToken String Body 否 601FA6A2-AC5C-4B59-BE11-378FTOKENA11 幂等...
更新故障影响服务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
component_name String ack-node-problem-detector 组件名称。version String 1.2.1 组件当前版本。说明 如果 version 值不为空,则表示该组件已经安装。next_version String 1.2.1 下一个可升级版本。changed String false 组件是否有更新...
component_name String ack-node-problem-detector 组件名称。version String 1.2.1 组件当前版本。说明 如果 version 值不为空,则表示该组件已经安装。next_version String 1.2.1 下一个可升级版本。changed String false 组件是否有更新...
Body 否 body type Integer Body 否 3 措施类型码表:PROBLEM_REPLAY_IMPROVEMENT content String Body 否 措施内容 措施内容 checkStandard String Body 否 2 验收标准 checkUserId Long Body 否 123 验收人id directorId Long Body 否 ...
component_name String ack-node-problem-detector 组件名称。version String 1.2.1 组件当前版本。说明 如果 version 值不为空,则表示该组件已经安装。next_version String 1.2.1 下一个可升级版本。changed String false 组件是否有更新...
problem/xxxxxxxssxxxa2c8-40b9-9162-08a6c2e338e2 图片key problemId Long Body 是 150000000 故障id clientToken String Body 否 e0b6735e-1a04-4d6b-a625-d2350612492c clientToken 返回数据 名称 类型 示例值 描述 requestId String c...
故障完结。调试 您可以在OpenAPI Explorer...ProblemStatusError The problem status is abnormal.故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
故障复盘 调试 您可以在OpenAPI Explorer...ProblemStatusError The problem status is abnormal.故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
如果是ACK集群,则对应阿里云Kubernetes组件中的ack-node-problem-detector组件已集成eventer和node-problem-detector功能,您只需要部署该组件。更多信息,请参见 事件监控。如果是 ACK Serverless集群,您需要部署kube-eventer组件。此处...
problem/xxxxxxxxxxxxxxxx1-b3185d529277 oss key policy String eyJleHBpcmF0a0p0IjoiMjAyMS0wNy0xM1QwNDowOTo0NS4yODJaIiwiY29uZGl0aW9ucyI6W1siY29udGVudC1sZW5ndGgtcmFuZ2UiLDAsMTA0ODU3NjAwXSxbInN0YXJ0cy13aXRoIiwiJGtleSIsInByb2...
install ack-node-problem-detector 预期输出:Addon ack-node-problem-detector, version xxx installed.通过控制台安装 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 ...
Integration>Problem notifications。在 Problem notifications 页面单击 Add notifications,添加一个事件通知,设置相关参数,然后单击 Save 进行保存。Display name:设置为事件通知的名称。Webhook URL:填写为步骤一中获取的 公网请求...
删除故障。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI ...ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
name String Body 否 ack-node-problem-detector 组件名称。cleanup_cloud_resources Boolean Body 否 true 是否清理云资源。示例 请求示例 POST clusters/c5b5e80b0b64a4bf6939d2d8fbbc5*/components/uninstall HTTP/1.1 Host:cs....
在 Problem notifications 页面单击 Add notifications 添加一个事件通知,设置相关参数,然后单击 Sava 进行保存。Display name:设置为事件通知的名称。Webhook URL 填写为步骤一中获取的 公网请求 URL。步骤三:触发事件 登录 Dynatrace...
name String Body 否 ack-node-problem-detector 组件名称。cleanup_cloud_resources Boolean Body 否 true 是否清理云资源。示例 请求示例 POST clusters/c5b5e80b0b64a4bf6939d2d8fbbc5*/components/uninstall HTTP/1.1 Host:cs....
删除故障改进措施 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
Long Body 否 123221 事件Id problemNotifyType String Body 否 PROBLEM_NOTIFY 通告类型 返回数据 名称 类型 示例值 描述 requestId String E789D869-DB13-4933-BAA8-A1F56F94B94D Id of the request data Object data problemId Long ...
删除影响服务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI ...ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。
name String Body 否 ack-node-problem-detector 组件名称。cleanup_cloud_resources Boolean Body 否 true 是否清理云资源。示例 请求示例 POST clusters/c5b5e80b0b64a4bf6939d2d8fbbc5*/components/uninstall HTTP/1.1 Host:cs....
problem-clb-bandwidthOverLimit CLB带宽规格超限丢包 严重 CLB带宽规格超限丢包 CLB实际流量超出带宽规格,出现丢包情况。建议扩容。具体操作,请参见 调整性能保障型实例的规格。problem-clb-connectionFail CLB失败连接数骤增 严重 CLB...