ARMS告警管理_智能告警_统一告警_容器中间件-阿里云

ARMS 告警管理
支持快速接入各类告警信息,通过自动去重、规则压缩、算法降噪,帮助运维团队减少告警,避免告警风暴。通过分派、排班、通知和ChatOps等功能,快速实现告警流程化管理,帮助运维团队更快响应告警,恢复告警,提升告警管理能力和应急协同能力。

产品优势

极致降噪,告别告警风暴
自定义规则策略配合智能算法,对事件及告警压缩降噪,有效避免无效告警与告警风暴
洞察根因,智能巡检与分析
内置常见异常巡检模型,一键开启智能洞察,提供完整监控数据与关联关系,快速发现业务问题,助力根因排查,提高故障排查效率
灵活管理,告警直达处理人
灵活的排班管理和丰富的通知渠道,让值班工程师更加从容应对众多告警
高效协同,实时跟进和处理
支持多种办公协同工具,无障碍连接多角色团队成员,与业务工单系统关联,及时通知与反馈工单处理结果

产品功能

告警概览可视化展现告警关键指标数据,告警统计概览和应急处置典型指标数据,即时掌握业务运行健康度情况。
告警集成丰富的预置集成组件,覆盖阿里云、开源主流监控系统。
通知集成支持短信、电话、钉钉、邮件、飞信等多种通知方式,同时也支持对接 Aone / Jira / PageDuty 等多种协同系统。
告警策略支持多种告警策略,如通知策略、升级策略、静默策略、抑制策略等,其中通知策略支持通过定义事件匹配规则,对告警事件进行精准识别,满足一类告警通知策略的统一配置。
事件处理流通过白屏化的事件处理流编排简单的处理流程,对任意告警源上报的告警事件进行再加工,以满足差异化的事件数据处理需求。适用于如联合 CMDB 系统提取机房、地域等信息;核心系统异常时告警等级提升等场景。
告警事件统计与分析基于已产生的告警事件明细数据,自由组合筛选条件进行实时分析,可以满足不同场景的自定义分析诊断需求。
告警处置支持在 IM 工具或者控制台内提供完整的告警全生命周期管理,如认领、关闭、屏蔽、关注、解决等。

应用场景

客户案例

极氪汽车
极氪通过建设端到端的全链路可观测体系、企业级应急响应机制和跨部门团队的人员协同机制,以业务连续性保障为目标,落地了极数BI业务数字化稳定性治理建设,大幅提升了整体应急响应效率。
Tims 天好咖啡
针对核心业务,结合业务实践和ARMS智能告警平台能力构建了完整及时的告警体系,借助以可观测为代表的阿里云云原生产品解决方案,Tims 天好咖啡更加从容的面对门店、交易数量、会员数量的急速增长,在愈发激烈的市场竞争中始终保持竞争优势。

文档与说明