阿里云文档 2026-04-01

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2026-03-06

在ACK集群中使用Gateway with Inference Extension路由外部MaaS服务

当 ACK 集群对接外部 MaaS 服务(如百炼)时,为统一处理 API 密钥和请求路径,可基于AI推理网关(Gateway with Inference Extension),配置路由规则(HTTPRoute),实现请求凭证的自动注入及URL重写,从而快速集成模型服务。

阿里云文档 2026-03-06

使用DRA调度GPU

在AI训练和推理场景中,当多个应用需要共享GPU资源时,为突破传统设备插件的调度限制,可在ACK集群中部署NVIDIA DRA驱动,通过Kubernetes DRA API实现Pod间GPU动态分配与细粒度资源控制,提升GPU利用率并降低成本。

阿里云文档 2026-01-07

调用DescribeAckClusterNamespaces接口查询ACK集群的命名空间列表-云防火墙-阿里云

查询阿里云K8S容器服务(ACK)集群命名空间。

文章 2024-08-25 来自:开发者社区

【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)

问题描述 使用Azure Kubernetes服务(AKS),可以通过kubectl连接 pod 中查看日志,但是如何来查看节点的系统日志呢?如是否有ubuntu系统升级的记录?   问题解答 是的,可以进入AKS的节点查看系统文件,如日志文件(/var/log) 或者由应用生产的其他日志。   具体的操作步骤如下: 第...

【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)
文章 2024-08-24 来自:开发者社区

在K8S中,如何收集k8s集群日志?

在 Kubernetes (K8S) 集群中收集日志通常涉及到几个层面:容器日志、Kubernetes 组件日志(如 kubelet、kube-apiserver 等)、以及系统日志。下面是一些常用的方法和工具来实现这些目标: 1. 使用 kubectl 命令获取容器日志 可以通过 kubectl logs 命令直接从 Pod 中获取容器日志: ...

问答 2024-08-05 来自:开发者社区

请问我的ack集群 pod日志如何收集?

请问我的ack集群 pod日志如何收集?

问答 2024-07-30 来自:开发者社区

k8s集群的服务日志的采集机制?

k8s集群的服务日志的采集机制?

问答 2024-07-18 来自:开发者社区

要接入自建Kubernetes(K8s)集群至阿里云日志服务(SLS)步骤是什么?

要接入自建Kubernetes(K8s)集群至阿里云日志服务(SLS)步骤是什么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。