阿里云文档 2026-04-01

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2026-03-06

在ACK集群中使用Gateway with Inference Extension路由外部MaaS服务

当 ACK 集群对接外部 MaaS 服务(如百炼)时,为统一处理 API 密钥和请求路径,可基于AI推理网关(Gateway with Inference Extension),配置路由规则(HTTPRoute),实现请求凭证的自动注入及URL重写,从而快速集成模型服务。

阿里云文档 2026-03-06

使用DRA调度GPU

在AI训练和推理场景中,当多个应用需要共享GPU资源时,为突破传统设备插件的调度限制,可在ACK集群中部署NVIDIA DRA驱动,通过Kubernetes DRA API实现Pod间GPU动态分配与细粒度资源控制,提升GPU利用率并降低成本。

阿里云文档 2026-01-07

调用DescribeAckClusterNamespaces接口查询ACK集群的命名空间列表-云防火墙-阿里云

查询阿里云K8S容器服务(ACK)集群命名空间。

文章 2024-08-19 来自:开发者社区

阿里云云效产品使用合集之如何在K8s集群上进行构建

问题一:在云效中如果分支冲突了,冲突的内容这些信息怎么通过接口获取的? 在云效中如果分支冲突了,冲突的内容这些信息怎么通过接口获取的?请参考图片: 参考答案: 这个目前不支持。 ...

阿里云云效产品使用合集之如何在K8s集群上进行构建
问答 2024-08-14 来自:开发者社区

代码master分支修改,通过云效打包,发布到ack serverless集群报错,如何解决?

代码master分支修改,通过云效打包,发布到ack serverless集群报错,如何解决? 但是我自己本地打包镜像,发布到ackserver less就可以。

问答 2024-08-09 来自:开发者社区

阿里云效,两个不同的vpc,我想通过a vpc里面的云效发布到b vpc里面的ACK集群该怎么配置?

阿里云效,两个不同的vpc,我想通过a vpc里面的云效发布到b vpc里面的ACK集群该怎么配置流水线?

文章 2024-07-18 来自:开发者社区

阿里云云效操作报错合集之AppStack资源池添加外部k8s集群时报错,该如何解决

问题一:云效现在出现这个问题怎么解决呢? 云效中,本地执行的企业id:6513b564dba61e96ebf6ab83,现在出现这个问题怎么解决呢? 参考回答: 这个问题出现的原因可能是网...

阿里云云效操作报错合集之AppStack资源池添加外部k8s集群时报错,该如何解决
文章 2024-07-18 来自:开发者社区

阿里云云效操作报错合集之在绑定其他主体下的k8s集群时,通过kubeconfig导入集群时,出现报错,该如何解决

问题一:云效代码域在docker构建这一步如何使用这些构建物呢? 云效代码域在docker构建这一步如何使用这些构建物呢?pipeline大致结构如图,java构建出多个jar,已上传到公共存储空间 ...

阿里云云效操作报错合集之在绑定其他主体下的k8s集群时,通过kubeconfig导入集群时,出现报错,该如何解决

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。