阿里云文档 2026-04-01

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2026-03-06

在ACK集群中使用Gateway with Inference Extension路由外部MaaS服务

当 ACK 集群对接外部 MaaS 服务(如百炼)时,为统一处理 API 密钥和请求路径,可基于AI推理网关(Gateway with Inference Extension),配置路由规则(HTTPRoute),实现请求凭证的自动注入及URL重写,从而快速集成模型服务。

阿里云文档 2026-03-06

使用DRA调度GPU

在AI训练和推理场景中,当多个应用需要共享GPU资源时,为突破传统设备插件的调度限制,可在ACK集群中部署NVIDIA DRA驱动,通过Kubernetes DRA API实现Pod间GPU动态分配与细粒度资源控制,提升GPU利用率并降低成本。

阿里云文档 2026-01-07

调用DescribeAckClusterNamespaces接口查询ACK集群的命名空间列表-云防火墙-阿里云

查询阿里云K8S容器服务(ACK)集群命名空间。

文章 2024-12-11 来自:开发者社区

阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案

本文整理自2024云栖大会苏雅诗演讲 K8s集群业务为什么需要灾备? 集群与业务自身的的高可用配置是集群稳定性的基石,能保证业务在基础设施突发故障的时候应用仍能稳定运行。 然而,在业务的快速迭代与集群的日常运维中,也可能出现人为误操作,比如集群资源的误删除。对于重要的业务,建议做周期性的灾备,并在业务迭代、回滚以及集群的高危操作前做单次的灾备...

阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案
文章 2024-09-30 来自:开发者社区

阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案

【阅读原文】戳:阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案 本文整理自2024云栖大会苏雅诗演讲   K8s集群业务为什么需要灾备?     集群与业务自身的的高可用配置是集群稳定性的基石,能保证业务在基础设施突发故障的时候应用仍能稳定运行。   然而,在业务的快速...

阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案
问答 2023-12-24 来自:开发者社区

再咨询一个阿里云OpenAPI,就是能不能获取到ack集群内,无状态应用中的当前副本数?

再咨询一个阿里云OpenAPI,就是能不能获取到ack集群内,无状态应用中的当前副本数?

文章 2022-11-20 来自:开发者社区

【公开课】手把手基于阿里云 ACK 环境创建 Kubernetes 集群及部署应用|学习笔记

开发者学堂课程【手把手基于阿里云 ACK 环境创建 Kubernetes 集群及部署应用:【公开课】手把手基于阿里云 ACK 环境创建 Kubernetes 集群及部署应用】学习笔记,与课程紧密联系,让用户快速学习知识。课程地址:https://developer.aliyun.com/learning/course/829/detail/13949【公开课】手把手基于阿里云 ACK 环境创建 ....

【公开课】手把手基于阿里云 ACK 环境创建 Kubernetes 集群及部署应用|学习笔记
文章 2022-08-25 来自:开发者社区

阿里云 ACK One 多集群管理全面升级:多集群服务、多集群监控、两地三中心应用容灾

作者:宇汇ACK One 概述ACK One 是阿里云面向混合云、多集群、分布式计算等场景推出的分布式云容器平台,能够统一管理阿里云上、边缘、部署在客户数据中心以及其他云上的 Kubernetes 集群,并简化集群管理界面,让企业轻松应对多集群形态,从而灵活地根据自身业务和数据管控等需求,同时使部署在客户数据中心的集群也能获取云上弹性算力,实现“计算无界”。三大重磅特性,覆盖三大场景,引领多集群....

阿里云 ACK One 多集群管理全面升级:多集群服务、多集群监控、两地三中心应用容灾

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。