阿里云文档 2025-01-14

支持的预设的系统权限策略列表

本文描述系统运维管理支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。

阿里云文档 2024-09-20

自动监控和响应ECS系统事件实现故障处理、动态调度等自动化运维

阿里云提供了ECS系统事件用于记录和通知云资源信息,例如ECS实例的启停、是否到期、任务执行情况等。在大规模集群、实时资源调度等场景,如果您需要主动监控和响应阿里云提供的ECS系统事件,来实现故障处理、动态调度等自动化运维,可通过云助手插件ecs-tool-event实现。

文章 2024-09-09 来自:开发者社区

自动化监控和响应ECS系统事件

阿里云提供了ECS系统事件用于记录和通知云资源信息,例如ECS实例的启停、是否到期、任务执行情况等。在大规模集群、实时资源调度等场景,如果您需要主动监控和响应阿里云提供的ECS系统事件,来实现故障处理、动态调度等自动化运维,可通过云助手插件ecs-tool-event实现。 说明 ECS系统事件是由阿里云定义的,用于记录和通知云资源的信息,例如运维任务执行情况、资源是...

文章 2024-08-16 来自:开发者社区

监控与日志管理:保障系统稳定运行与高效运维的基石

在当今复杂多变的IT环境中,无论是大型企业级应用还是初创公司的微服务架构,系统的稳定运行和高效运维都是业务成功的关键。而监控与日志管理作为运维管理的两大支柱,其重要性不言而喻。本文将深入探讨监控与日志管理的重要性,以及它们如何助力企业构建稳健、可维护的系统架构。 一、监控:系统健康的守护者 1.1 实时监控,快速...

阿里云文档 2024-04-18

支持的预设的系统权限策略列表

本文描述特权访问服务支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。

阿里云文档 2024-04-18

支持的预设的系统权限策略列表

本文描述堡垒机支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。

阿里云文档 2023-10-19

系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。

文章 2022-11-24 来自:开发者社区

多监控系统产生的告警如何高效管理-运维事件中心

随着互联网服务深入千行百业,数字化成为企业和机构为用户提供服务的重要形式。在企业的IT基础架构趋于复杂化的过程中,运维管理工作的技术性也有了更高的要求。如果针对相关的故障,企业无法做到及时的发现和响应,将会延长上层业务中断的事件,缺位的运维将会直接造成企业的经济损失,使企业的客户信任度和社会声誉受到影响。安全、稳定的基础平台除了可以保障业务正常运转外,有效的运维事件管理还能充分发挥IT基础架构的....

多监控系统产生的告警如何高效管理-运维事件中心
文章 2022-07-29 来自:开发者社区

彻底搞懂监控系统,使用Prometheus和Grafana 如何实现运维告警?

之前我们搭建好了监控环境并且监控了服务器、数据库、应用,运维人员可以实时了解当前被监控对象的运行情况,但是他们不可能时时坐在电脑边上盯着DashBoard,这就需要一个告警功能,当服务器或应用指标异常时发送告警,通过邮件或者短信的形式告诉运维人员及时处理。接下来就来介绍非常重要的功能——告警。一、告警的实现方式Prometheus将数据采集和告警分成了两个模块。报警规则配置在Prometheus....

彻底搞懂监控系统,使用Prometheus和Grafana 如何实现运维告警?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐