阿里云文档 2025-10-17

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2025-09-25

ACK集群巡检APIServer绑定的CLB端口监听配置正常

ACK集群巡检的检测项“APIServer CLB 6443 端口监听配置异常”无风险,视为“合规”。规则通过获取最后一次巡检报告结果作为检测依据,如果集群未开通巡检配置评估为“不适用”;如果集群开通了配置,但是运行的巡检任务不存在或者运行最后一次任务未结束,评估为“无数据”。

阿里云文档 2025-09-25

ACK集群节点池伸缩配置可用性检测

检测ACK集群巡检中的“节点池伸缩配置不可用”风险项。当此巡检项无风险时,视为“合规”。规则通过获取最后一次巡检报告结果作为检测依据,如果集群未开通巡检配置评估为“不适用”。

阿里云文档 2025-09-25

配置混合云节点池DNS解析

混合云节点池如通过云上CoreDNS解析域名,频繁的访问会加重专线负载,还可能出现因专线不稳定导致的域名解析失败,配置NodeLocal DNSCache可减少这些问题的影响。

阿里云文档 2025-09-22

使用Gateway with Inference Extension为SGLang PD分离服务配置推理路由

Prefill/Decode分离架构(PD分离),是当前主流的LLM推理优化技术,通过将LLM推理中的两个核心阶段解耦并分开部署在不同GPU上,避免资源争抢,从而显著降低TPOT,提升系统吞吐。本文以Qwen3-32B模型为例,演示如何通过Gateway with Inference Extension为部署在ACK中的SGLang PD分离架构模型推理服务。

问答 2023-11-01 来自:开发者社区

云效部署的时候,k8s环境如何配置,然后java 程序如何读取?

云效部署的时候,k8s环境如何配置,然后java 程序如何读取?

文章 2023-08-14 来自:开发者社区

K8s环境下监控告警平台搭建及配置

Promethues是可以单机搭建的,参考prometheus入门本文是就Promethues+Grafana在K8s环境下的搭建及配置Prometheus度量指标监控平台简介启动minikube  minikube start安装helm使用Helm Chart 安装 Prometheus Operator:helm install prometheus-operator stabl....

K8s环境下监控告警平台搭建及配置
文章 2022-12-16 来自:开发者社区

关于K8s集群环境工作组隔离配置多集群切换的一些笔记

写在前面分享一些 K8s 中集群管理的笔记博文内容涉及集群环境隔离的相关配置:单集群多命名空间隔离及用户认证鉴权配置 Demo多集群的统一管理配置,集群切换 Demo理解不足小伙伴帮忙指正食用方式: 需要了解 K8s 集群,RBAC 鉴权,CA 认证相关知识 佛告须菩提:"凡所有相,皆是虚妄,若见诸相非相,则见如来" --- 《金刚经》在一个 Team 中,如果使用同一个集群,不同的工作组需要在....

问答 2022-08-08 来自:开发者社区

在K8S环境下容器seata如何配置nacos的地址呢?

在K8S环境下容器seata如何配置nacos的地址呢? 

文章 2018-06-07 来自:开发者社区

如何在 Kubernetes 环境中搭建 MySQL (二):在 cloud native 环境下配置 MySQL 的几个关键点

MySQL   MySQL 在 Kubernetes 环境中运行这件事情本身并不困难,最简单的方式就是找到 MySQL 的 Docker image,跑起来就行了,但是要做到生产环境可用,还是有几个问题要解决,所以本文不对整个流程做详细的描述,而是把重点放在几个难点上。 1. Kubernetes 如何与 Ceph 联动 1.1 使用到的 Kubernetes 概念 Persistent V...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注