阿里云文档 2026-01-07

调用DescribeAckClusterNamespaces接口查询ACK集群的命名空间列表-云防火墙-阿里云

查询阿里云K8S容器服务(ACK)集群命名空间。

阿里云文档 2025-10-23

在ACK集群中使用Gateway with Inference Extension路由外部MaaS服务

当 ACK 集群对接外部 MaaS 服务(如百炼)时,为统一处理 API 密钥和请求路径,可基于AI推理网关(Gateway with Inference Extension),配置路由规则(HTTPRoute),实现请求凭证的自动注入及URL重写,从而快速集成模型服务。

阿里云文档 2025-10-17

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2025-10-17

使用DRA调度GPU

在AI训练和推理场景中,当多个应用需要共享GPU资源时,为突破传统设备插件的调度限制,可在ACK集群中部署NVIDIA DRA驱动,通过Kubernetes DRA API实现Pod间GPU动态分配与细粒度资源控制,提升GPU利用率并降低成本。

文章 2025-01-07 来自:开发者社区

ACK One多集群网关:实现高效容灾方案

【阅读原文】戳:ACK One多集群网关:实现高效容灾方案 概述       从业务架构上来说,企业的业务系统自上而下通常分为接入层、应用层和数据层。   • 接入层:流量入口,负责接收流量,根据路由转发规则将流量转发到后端应用层。   • 应用层:应用服...

ACK One多集群网关:实现高效容灾方案
文章 2024-02-05 来自:开发者社区

监控 Kubernetes 集群证书过期时间的三种方案

前言 Kubernetes 中大量用到了证书, 比如 ca 证书、以及 kubelet、apiserver、proxy、etcd 等组件,还有 kubeconfig 文件。 如果证书过期,轻则无法登录 Kubernetes 集群,重则整个集群异常。 为了解决证书过期的问题,一般有以下几种方式: 大幅延长证书有效期,短则 10 年,长则 100 年; ...

监控 Kubernetes 集群证书过期时间的三种方案
文章 2023-11-15 来自:开发者社区

kubernetes集群测试方案及工具?

对于大规模的Kubernetes集群的测试,有很多不同的方面需要注意。以下是几个常见的Kubernetes集群测试方案及其具体方法: 集群规模扩展性:为了验证大型集群的稳定性和可伸缩性,可以增加集群节点的数量并观察集群的行为。您可以使用Kubemark等工具模拟大规模集群环境来进行压力测试和性能评估。调度速率:要测试Kuber...

问答 2023-11-15 来自:开发者社区

kubernetes集群测试方案及工具?

跪求各位大佬,想问一下,kubernetes集群测试有啥好的方案及具体,比如测试集群节点最大极限、测试集群调度速率、测试etcd、测试apiserver等等

文章 2022-12-13 来自:开发者社区

kubernetes 部署Prometheus监控集群传统部署方案)(2)

3.1.5 创建prometheus svc会生成一个CLUSTER-IP进行集群内部的访问,CLUSTER-IP也可以自己指定。使用以下命令创建Prometheus要用的service:$ kubectl create -f prometheus-service.yamlprometheus-service.yaml文件内容如下:apiVersion: v1 kind: Service met....

kubernetes 部署Prometheus监控集群传统部署方案)(2)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注