阿里云文档 2026-04-01

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2026-03-06

在ACK集群中使用Gateway with Inference Extension路由外部MaaS服务

当 ACK 集群对接外部 MaaS 服务(如百炼)时,为统一处理 API 密钥和请求路径,可基于AI推理网关(Gateway with Inference Extension),配置路由规则(HTTPRoute),实现请求凭证的自动注入及URL重写,从而快速集成模型服务。

阿里云文档 2026-03-06

使用DRA调度GPU

在AI训练和推理场景中,当多个应用需要共享GPU资源时,为突破传统设备插件的调度限制,可在ACK集群中部署NVIDIA DRA驱动,通过Kubernetes DRA API实现Pod间GPU动态分配与细粒度资源控制,提升GPU利用率并降低成本。

阿里云文档 2026-01-07

调用DescribeAckClusterNamespaces接口查询ACK集群的命名空间列表-云防火墙-阿里云

查询阿里云K8S容器服务(ACK)集群命名空间。

文章 2025-03-31 来自:开发者社区

K8s集群实战:使用kubeadm和kuboard部署Kubernetes集群

在云计算和微服务的时代,离不开容器集群的管理系统,Kubernetes(K8s)便是其中的佼佼者。那么,如何运用kubeadm和kuboard轻松布署一个稳定的K8s集群呢?以下是一段详细而形象的流程。 首先,确保你已经拥有了一台或一台以上的Linux服务器,因为Kubernetes是...

文章 2024-09-03 来自:开发者社区

CentOS 7.9二进制部署K8S 1.28.3+集群实战

前置知识: 部署Kubernetes集群的方式 目前生产环境部署kubernetes集群主要由两种方式: - kubeadm: kubeadm是一个K8S部署工具,提供kubeadm init和kubeadm join,用于快速部署kubernetes集群。 - 二进制部署: 从GitHub下载发行版的二进制包,手动部署每个组件,组成kube...

CentOS 7.9二进制部署K8S 1.28.3+集群实战
文章 2024-09-03 来自:开发者社区

二进制部署Kubernetes 1.23.15版本高可用集群实战

前置知识: 部署Kubernetes集群的方式 目前生产环境部署kubernetes集群主要由两种方式: - kubeadm: kubeadm是一个K8S部署工具,提供kubeadm init和kubejoin,用于快速部署kubernetes集群。 - 二进制部署: 从GitHub下载发行版的二进制包,手动部署每个组件,组成kubernetes...

二进制部署Kubernetes 1.23.15版本高可用集群实战
文章 2024-09-03 来自:开发者社区

CentOS 7.6使用kubeadm部署k8s 1.17.2测试集群实战篇

作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任。   kubernetes技术已经称为原生云技术的事实标准,它是目前基础软件领域最为热门的分布式调度和管理平台。于是,kubernetes也几乎成了时下开发工程师和运维工程师必备的技能之一。今天我们就来一起搭建一个Mini版本的kubernetes集群来简单体验一下吧。 一.主机基础环境准备 1>.测试环境说明   测试...

CentOS 7.6使用kubeadm部署k8s 1.17.2测试集群实战篇
文章 2023-11-27 来自:开发者社区

阿里云 ACK 云上大规模 Kubernetes 集群高可靠性保障实战

1.引言2023 年 7 月,阿里云容器服务 ACK 成为首批通过中国信通院“云服务稳定运行能力-容器集群稳定性”评估的产品, 并荣获“先进级”认证。随着 ACK 在生产环境中的采用率越来越高,稳定性保障已成为基本诉求。本文基于 ACK 稳定性保障实践经验,帮助用户全面理解 ACK 稳定性理论和优化策略,并了解如何使用相应的工具和服务进行稳定性保障。2.K8s 集群稳定性和大规模场景下的挑战2.....

阿里云 ACK 云上大规模 Kubernetes 集群高可靠性保障实战

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。