.
AIOps智能监控解决方案技术架构
  • 技术架构

-->通过数据的时间序列分析和大规模数据的机器学习产生智能基线自动报警。

  • 不需要配置报警规则,降低人工维护成本
  • 大幅减少传统基于静态阈值告警的误报漏报数量

-->根据周期性趋势预测的变化,自动调节参数,不断提升预测模型的准确率和召回率。

  • 充分考虑业务整体起伏趋势
  • 可以应对业务局部趋势变化

-->提供方便高效的监控接入和管理能力。

  • 支持多种监控系统数据一键接入
  • 支持监控分组树形管理和报警干系人配置
  • 支持灵活的报警抑制和发送策略配置

阿里巴巴内部使用效果

核心业务指标监控的准确率
高于80%
故障发现召回率
高于90%
每周为团队节省
29小时
联系顾问

方案业务场景及优势

  • 提高故障告警准确率
  • 减少业务故障风险
  • 缩短故障发现时间
  • 系统级指标无阈值智能检测

提高故障告警准确率

  • 通过时间序列分析、机器学习算法模型,不断提升算法的告警准确率。以对每天业务峰值点的监控为例,传统的静态阈值或同环比策略,在业务的趋势起伏的周期性变化下会产生多次误报。而AIOps智能监控解决方案以智能基线为基准,能够准确预测并拟合业务趋势,基于机器学习策略进行异常检测,能够有效避免这类误报,同时精确发现业务异常,提升告警准确率。

减少业务故障风险

  • 智能预测业务指标趋势,提前发现可能的异常变化并进行故障应急处理,降低业务故障风险的概率。

缩短故障发现时间

  • 最细粒度可对10秒级监控数据进行精确的实时检测,让用户更早感知业务故障并作出响应.

系统级指标无阈值智能检测

  • 根据指标变化自动调整算法参数,实现自动进化,全程自动学习达到无人干预的全自动模式。能够实现对指标日常波动范围的自适应学习,并精确发现系统指标中不同寻常的波动。

提高故障告警准确率

提高故障告警准确率

  • 通过时间序列分析、机器学习算法模型,不断提升算法的告警准确率。以对每天业务峰值点的监控为例,传统的静态阈值或同环比策略,在业务的趋势起伏的周期性变化下会产生多次误报。而AIOps智能监控解决方案以智能基线为基准,能够准确预测并拟合业务趋势,基于机器学习策略进行异常检测,能够有效避免这类误报,同时精确发现业务异常,提升告警准确率。

减少业务故障风险

减少业务故障风险

  • 智能预测业务指标趋势,提前发现可能的异常变化并进行故障应急处理,降低业务故障风险的概率。

缩短故障发现时间

缩短故障发现时间

  • 最细粒度可对10秒级监控数据进行精确的实时检测,让用户更早感知业务故障并作出响应.

系统级指标无阈值智能检测

系统级指标无阈值智能检测

  • 根据指标变化自动调整算法参数,实现自动进化,全程自动学习达到无人干预的全自动模式。能够实现对指标日常波动范围的自适应学习,并精确发现系统指标中不同寻常的波动。

方案使用步骤

下单/申请试用

点击联系顾问,购买或申请测试

安装部署

根据需求准备环境,安装部署

对接数据源

系统中对接监控数据源,例如Arms、科来、Zabbix、Prometheus等

报警接收信息

配置报警接收渠道

下单/申请试用

点击联系顾问,购买或申请测试

安装部署

根据需求准备环境,安装部署

对接数据源

系统中对接监控数据源,例如Arms、科来、Zabbix、Prometheus等

报警接收信息

配置报警接收渠道