阿里云文档 2025-10-17

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2025-09-12

单集群应用迁移至舰队并分发到多集群

为解决应用多集群部署时的重复操作,易出错,难同步等问题,可使用AMC命令行工具将应用快速部署到多个集群,并实现后续统一管理和自动同步更新。

阿里云文档 2025-09-12

单集群应用迁移至舰队并分发到多集群

为解决应用多集群部署时的重复操作,易出错,难同步等问题,可使用AMC命令行工具将应用快速部署到多个集群,并实现后续统一管理和自动同步更新。

阿里云文档 2025-07-29

基于ACK One ALB多集群网关实现异地容灾

ACK One支持通过ALB多集群网关来实现异地容灾系统,异地容灾可以防范地域性质的灾难损害,例如地震、水灾等灾害,但同时会带来更高的延迟、更高的费用及维护成本。本文将介绍通过ALB多集群网关来实现异地容灾系统的架构和使用场景。

阿里云文档 2025-07-14

从源码、脚本和压缩包构建Python应用并部署至容器服务K8s集群

EDAS现支持从源码、脚本和压缩包构建Python应用并部署至EDAS的容器服务K8s集群,并提供了应用扩缩、监控报警、负载均衡和限流降级等能力。本文介绍如何从源码构建Python应用并部署至容器服务K8s集群。

问答 2024-07-31 来自:开发者社区

在阿里云ARMS都是k8s的pod服务,监控有的应用有数据,有的却没有,为什么?

在阿里云ARMS都是k8s的pod服务,监控有的应用有数据,有的却没有,为什么?我试了两次把有数据的探针设置批量复制到其它没数据的应用,还是一样的没数据,检查了探针也安装了。

文章 2024-05-29 来自:开发者社区

Kubernetes 集群的持续监控与性能优化策略深度学习在图像识别中的应用与挑战

随着容器技术的快速发展,越来越多的企业和开发者选择使用 Kubernetes 作为容器编排工具。它提供了强大的管理功能,包括服务发现、自动扩缩容、负载均衡等。但在享受这些便利的同时,我们也面临着监控和性能优化的挑战。有效的监控可以帮助我们及时发现问题,而合理的优化措施则能够保障服务的持续稳定运行。 首先,对于 Kubernet...

问答 2024-04-03 来自:开发者社区

阿里云ARMS的K8s容器下面开应用监控,监控容器的java应用,有什么好的产品么?

阿里云ARMS的K8s容器下面开应用监控,监控容器的java应用,有什么好的产品么?我看这个java监控是一个探针一个实例来算的,那如果一个java应用有多个副本那岂不是价格翻几倍。

问答 2022-10-24 来自:开发者社区

AHAS中k8s接入ahas后可以监控到应用,但是没有监控到请求流量是为什么呀?

AHAS中k8s接入ahas后可以监控到应用,dubbo框架接入的,没有rpc服务,dubbo的版本是2.8.1,但是没有监控到请求流量是为什么呀?

文章 2022-04-13 来自:开发者社区

通过Kubernetes监控探索应用架构,发现预期外的流量

大家好,我是阿里云云原生应用平台的炎寻,很高兴能和大家一起在 Kubernetes 监控系列公开课上进行交流。本次公开课期望能够给大家在 Kubernetes 容器化环境中快速发现和定位问题带来新的解决思路。 为什么需要 Kubernetes 监控?很多同学对应用性能监控应该并不陌生,这类监控主要关注业务应用逻辑、应用框架和语言运行时,监控对象有线程池满,数据库连接无法获取,MySQL....

通过Kubernetes监控探索应用架构,发现预期外的流量

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注