阿里云文档 2026-04-01

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2026-03-06

在ACK集群中使用Gateway with Inference Extension路由外部MaaS服务

当 ACK 集群对接外部 MaaS 服务(如百炼)时,为统一处理 API 密钥和请求路径,可基于AI推理网关(Gateway with Inference Extension),配置路由规则(HTTPRoute),实现请求凭证的自动注入及URL重写,从而快速集成模型服务。

阿里云文档 2026-03-06

使用DRA调度GPU

在AI训练和推理场景中,当多个应用需要共享GPU资源时,为突破传统设备插件的调度限制,可在ACK集群中部署NVIDIA DRA驱动,通过Kubernetes DRA API实现Pod间GPU动态分配与细粒度资源控制,提升GPU利用率并降低成本。

阿里云文档 2026-01-07

调用DescribeAckClusterNamespaces接口查询ACK集群的命名空间列表-云防火墙-阿里云

查询阿里云K8S容器服务(ACK)集群命名空间。

文章 2025-03-13 来自:开发者社区

打破资源边界、告别资源浪费:ACK One 多集群Spark和AI作业调度

【阅读原文】戳:打破资源边界、告别资源浪费:ACK One多集群Spark和AI作业调度   概述       在云原生时代,随着业务的发展(如业务遍布全球、已达单一集群承载上限)、容灾需求的迫切、安全合规的要求等原因,越来越多的用户采用多Kubernetes集群来承载业务。而在Kubernetes...

打破资源边界、告别资源浪费:ACK One 多集群Spark和AI作业调度
文章 2025-02-26 来自:开发者社区

ACK One多集群Service帮助大批量应用跨集群无缝迁移

【阅读原文】戳:ACK One多集群Service帮助大批量应用跨集群无缝迁移 概述       在云原生时代,应用的快速迭代和灵活部署至关重要。而随着业务的变化与发展,在Kubernetes集群间迁移应用常有发生,往往发生在诸如跨云搬迁、平台重大升级、资源规划变更等场景下。将大批量应用从一个集群迁移到另一...

ACK One多集群Service帮助大批量应用跨集群无缝迁移
文章 2025-01-07 来自:开发者社区

ACK One多集群网关:实现高效容灾方案

【阅读原文】戳:ACK One多集群网关:实现高效容灾方案 概述       从业务架构上来说,企业的业务系统自上而下通常分为接入层、应用层和数据层。   • 接入层:流量入口,负责接收流量,根据路由转发规则将流量转发到后端应用层。   • 应用层:应用服...

ACK One多集群网关:实现高效容灾方案
文章 2024-10-30 来自:开发者社区

ACK One应用分发上线:高效管理多集群应用

【阅读原文】戳:ACK One应用分发上线:高效管理多集群应用 多集群应用资源分发概述       在现代应用交付环境中,企业愈发依赖多集群架构以提升应用部署的弹性、容错性和可扩展性。然而,跨多集群分发和管理应用资源复杂且耗时,一直是困扰企业的难题。为解决这一难题,ACK One[1]正式推出业界领先的多集...

ACK One应用分发上线:高效管理多集群应用
文章 2024-10-29 来自:开发者社区

ACK One GitOps:ApplicationSet UI简化多集群GitOps应用管理

【阅读原文】戳:ACK One GitOps:ApplicationSet UI简化多集群GitOps应用管理 Argo CD是适用于Kubernetes的声明式GitOps持续交付工具,它是CNCF社区的毕业项目。Application是其核心的资源,声明将指定Git仓库中的应用下发到指定的集群中。但是每个Application同时只能发送到1个集群,所以在多集群GitOps...

ACK One GitOps:ApplicationSet UI简化多集群GitOps应用管理

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。