阿里云文档 2026-04-01

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2026-03-06

在ACK集群中使用Gateway with Inference Extension路由外部MaaS服务

当 ACK 集群对接外部 MaaS 服务(如百炼)时,为统一处理 API 密钥和请求路径,可基于AI推理网关(Gateway with Inference Extension),配置路由规则(HTTPRoute),实现请求凭证的自动注入及URL重写,从而快速集成模型服务。

阿里云文档 2026-03-06

使用DRA调度GPU

在AI训练和推理场景中,当多个应用需要共享GPU资源时,为突破传统设备插件的调度限制,可在ACK集群中部署NVIDIA DRA驱动,通过Kubernetes DRA API实现Pod间GPU动态分配与细粒度资源控制,提升GPU利用率并降低成本。

阿里云文档 2026-01-07

调用DescribeAckClusterNamespaces接口查询ACK集群的命名空间列表-云防火墙-阿里云

查询阿里云K8S容器服务(ACK)集群命名空间。

文章 2024-12-28 来自:开发者社区

ubuntu使用kubeadm搭建k8s集群

Ubuntu 使用 kubeadm 搭建 Kubernetes 集群 Kubernetes 是一个开源的容器编排平台,kubeadm 是 Kubernetes 官方提供的一个工具,用于快速搭建 Kubernetes 集群。本文将详细介绍如何在 Ubuntu 系统上使用 kubeadm 搭建一个 Kubernetes 集群,包括准备工作、安装 Kubern...

文章 2024-09-03 来自:开发者社区

kubeadm快速构建K8S1.28.1高可用集群

一.K8S集群基础环境准备 1.配置主机解析 cat >> /etc/hosts <<EOF 10.0.0.66 k8s66 10.0.0.77 k8s77 10.0.0.88 k8s88 10.0.0.99 api-server EOF 2.禁用不必要的服务 2.1 禁用防火墙,网络管理,邮箱 systemctl disable --now...

文章 2024-09-03 来自:开发者社区

CentOS 7.6使用kubeadm部署k8s 1.17.2测试集群实战篇

作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任。   kubernetes技术已经称为原生云技术的事实标准,它是目前基础软件领域最为热门的分布式调度和管理平台。于是,kubernetes也几乎成了时下开发工程师和运维工程师必备的技能之一。今天我们就来一起搭建一个Mini版本的kubernetes集群来简单体验一下吧。 一.主机基础环境准备 1>.测试环境说明   测试...

CentOS 7.6使用kubeadm部署k8s 1.17.2测试集群实战篇
文章 2024-04-28 来自:开发者社区

一文教会你,如何通过kubeadm,在生产环境部署K8S高可用集群(二)

一文教会你,如何通过kubeadm,在生产环境部署K8S高可用集群(一):https://developer.aliyun.com/article/1495644 Run ‘kubectl get nodes’ to see this node join the cluster. node节点加入: kubeadm join 10.10.0.10:7443 --token...

文章 2024-04-28 来自:开发者社区

一文教会你,如何通过kubeadm,在生产环境部署K8S高可用集群(一)

使用kubeadm安装K8S 我们都知道,k8s中有三位大哥:kubelet, kubeadm, kubectl. 其中: kubelet是服务,用来调用下层的container管理器,从而对底层容器进行管理。 kubectl是API,供我们调用,键入命令对k8s资源进行管理。 kubeadm是管理器,我们可以使用它进行k8s节点的管理。 今天,我...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。