阿里云文档 2025-11-21

采集ACS集群的容器监控Prometheus Metrics指标

为了采集ACS集群中指定GPU-HPN节点或虚拟节点的Metrics数据,ACS在多个采集端点中提供了不同类型的指标。您可以通过修改Prometheus监控配置来采集目标节点的Metrics。

阿里云文档 2025-10-28

可观测监控Prometheus版支持的容器集群基础指标有哪些

本文介绍可观测监控 Prometheus 版支持的容器集群基础指标。

阿里云文档 2025-07-15

如何通过阿里云注册集群和Prometheus实现多云容器集群监控

本文为您介绍容器集群可观测现状、多云容器集群可观测挑战、以及应对这些挑战可选的实现方案,并且以具体多云容器集群场景案例为您介绍如何使用阿里云可观测监控 Prometheus 版和阿里云注册集群的结合实现多云容器集群的纳管监控。

阿里云文档 2025-05-27

采集容器集群中符合Prometheus默认采集规则的监控指标

通过开启默认服务发现功能,您可以采集容器集群中符合Prometheus默认采集规则的监控指标,帮助您进行集群运维和性能分析。

阿里云文档 2025-03-27

什么是性能监控套件与集群事件采集能力(Prometheus )

Prometheus实例 for 容器服务类型包年包月计费方式内置了性能监控套件和集成K8s事件能力,包括集成事件采集、工作负载性能监控、Ingress性能监控、CoreDNS性能监控功能。

文章 2023-07-11 来自:开发者社区

高可用Prometheus集群

背景一个应用于生产环境的监控服务,单机Promtheus往往是无法满足需求的,此时就要搭建一套Prometheus集群,此时就需要考虑:服务高可用:服务要冗余备份,以消除单点故障。数据一致性:冗余结点之间数据需要保证一致性。水平可扩展:可以通过增加服务数量,线性提高服务能力。数据持久化:节点故障数据不丢失、海量历史数据存储服务高可用Prometheus采用Pull模型收集监控数据,服务高可用意味....

高可用Prometheus集群
文章 2022-08-07 来自:开发者社区

高可用prometheus集群方案选型分享

     Prometheus采用Pul模型收集监控数据,服务高可用意味着同一个服务需要至少两个节点同时拉取或者切换为Push模型,使用一致性哈希,将不同实例的Metrics推送到固定推送到其中一台服务,这个模式优势是,在保障服务可用性的同时,资源消耗量少一半;新节点不需要重新配置抓取规则可以做到快速平行扩容。但缺点是,节点故障将导致历史数据丢失。应用于生产环境的监....

高可用prometheus集群方案选型分享

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

云原生

阿里云拥有国内全面的云原生产品技术以及大规模的云原生应用实践,通过全面容器化、核心技术互联网化、应用 Serverless 化三大范式,助力制造业企业高效上云,实现系统稳定、应用敏捷智能。拥抱云原生,让创新无处不在。

+关注