阿里云文档 2025-10-17

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2025-09-25

ACK集群巡检APIServer绑定的CLB端口监听配置正常

ACK集群巡检的检测项“APIServer CLB 6443 端口监听配置异常”无风险,视为“合规”。规则通过获取最后一次巡检报告结果作为检测依据,如果集群未开通巡检配置评估为“不适用”;如果集群开通了配置,但是运行的巡检任务不存在或者运行最后一次任务未结束,评估为“无数据”。

阿里云文档 2025-09-25

ACK集群节点池伸缩配置可用性检测

检测ACK集群巡检中的“节点池伸缩配置不可用”风险项。当此巡检项无风险时,视为“合规”。规则通过获取最后一次巡检报告结果作为检测依据,如果集群未开通巡检配置评估为“不适用”。

阿里云文档 2025-09-25

配置混合云节点池DNS解析

混合云节点池如通过云上CoreDNS解析域名,频繁的访问会加重专线负载,还可能出现因专线不稳定导致的域名解析失败,配置NodeLocal DNSCache可减少这些问题的影响。

阿里云文档 2025-09-22

使用Gateway with Inference Extension为SGLang PD分离服务配置推理路由

Prefill/Decode分离架构(PD分离),是当前主流的LLM推理优化技术,通过将LLM推理中的两个核心阶段解耦并分开部署在不同GPU上,避免资源争抢,从而显著降低TPOT,提升系统吞吐。本文以Qwen3-32B模型为例,演示如何通过Gateway with Inference Extension为部署在ACK中的SGLang PD分离架构模型推理服务。

文章 2025-07-31 来自:开发者社区

ACK GIE配置建议

Gateway with Inference Extension组件是基于Kubernetes社区Gateway API及其Inference Extension规范实现的增强型组件,支持Kubernetes四层/七层路由服务,并提供面向生成式AI推理场景的一系列增强能力。它能够简化生成式AI推理服务的管理流程,并优化在多个推理服务工作负载之间的负载均衡...

文章 2025-03-28 来自:开发者社区

Kubernetes监控:Prometheus与AlertManager结合,配置邮件告警。

好的,如果您想配置Prometheus与AlertManager来进行Kubernetes的监控,并希望当警告触发时发送邮件,这样的设置过程可以分为几个步骤:安装和配置Prometheus,安装和配置Alertmanager,然后链接Prometheus和Alertmanager,最后雕琢告警规则。...

文章 2024-11-14 来自:开发者社区

如何在Kubernetes中配置镜像和容器的定期垃圾回收

在Kubernetes中,kubelet负责镜像和容器的垃圾回收工作。虽然Kubernetes没有提供一个直接的“定期垃圾回收”设置,但你可以通过配置kubelet的相关参数来实现类似的效果。以下是在Kubernetes中配置镜像和容器定期垃圾回收的步骤: 一、配置kubelet参数 找到kubelet配置文件: kubelet的配置文件通...

文章 2024-09-28 来自:开发者社区

深入理解Kubernetes配置:编写高效的YAML文件

引言: 简要介绍Kubernetes(k8s)作为容器编排平台的重要性。 强调YAML文件在Kubernetes配置中的核心地位。 提及YAML文件的易读性、可扩展性和与Kubernetes API的紧密集成。 一、YAML基础 定义YAML:YAML(YAML Ain't Markup Language)是一种直观的数据序列化格式,易于人类阅读和编写,同...

深入理解Kubernetes配置:编写高效的YAML文件
问答 2024-08-26 来自:开发者社区

在负载均衡ALB中,请教一下K8S里的ALB如何配置超时时间?

在负载均衡ALB中,请教一下K8S里的ALB如何配置超时时间?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

密钥管理服务
密钥管理服务(KMS)提供安全合规的密钥托管和密码服务,助您轻松使用密钥来加密保护敏感的数据资产,控制云上的分布式计算和存储环境。
产品优势

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注