阿里云文档 2025-12-29

Pod在灵骏节点使用RDMA网络

本文档介绍如何在ACK托管集群Pro版的灵骏节点中配置和使用RDMA(RemoteDirect Memory Access)技术,实现高性能容器网络通信。RDMA技术可显著降低网络延迟并提升吞吐量,适用于高性能计算(HPC)、AI训练、分布式存储等对网络性能要求严苛的场景。

阿里云文档 2025-12-25

采集ACS Pod的Prometheus Metrics指标

为了采集指定GPU-HPN节点或虚拟节点的Metrics数据,ACS在多个采集端点中提供了不同类型的指标。您可以通过修改Prometheus监控配置来采集目标节点的Metrics。

阿里云文档 2025-09-25

ACK集群CoreDNS的Pod状态检测

检测ACK集群巡检中的“存在异常的CoreDNS Pod”风险项。当此巡检项无风险时,视为“合规”。规则通过获取最后一次巡检报告结果作为检测依据,如果集群未开通巡检配置评估为“不适用”。

阿里云文档 2025-04-10

如何使用ImageCache加速创建Pod

阿里云以ImageCache CRD的方式将ECI的镜像缓存(即ImageCache)功能提供给Kubernetes用户,以便在Kubernetes集群中也可以使用该功能来加速创建ECI Pod。本文介绍ImageCache的功能,以及如何创建和使用ImageCache。

阿里云文档 2025-04-01

ACS Pod增加EphemeralStorage

ACS Pod默认提供30 GiB的免费的临时存储空间(EphemeralStorage),如果该存储空间大小无法满足您的需求,您可以自定义增加临时存储空间大小。

文章 2024-08-24 来自:开发者社区

在K8S中,如果是因为开发写的镜像问题导致pod起不来该怎么排查?

在Kubernetes(K8S)中,如果Pod无法启动是由于开发编写的镜像问题导致的,可以通过以下步骤进行详细排查: 一、检查镜像状态 确认镜像名称和标签: 使用kubectl describe pod <pod-name>命令查看Pod的详细信息,确认Pod中引用的镜像名称和标签是否正确。 检查...

文章 2024-08-24 来自:开发者社区

在K8S中,在服务上线的时候Pod起不来怎么进行排查?

当 Kubernetes (K8S) 中的服务上线时 Pod 无法启动,可以按照以下步骤进行详细的排查: 1. 检查 Pod 的状态 首先使用 kubectl get pods 命令查看 Pod 的状态,确认 Pod 是否处于 Running 状态。如果 Pod 处于 Pending、Error 或其他非正常状态,则需要进一步排查。 ...

文章 2024-08-24 来自:开发者社区

在K8S中,Pod⼀直处于Init状态,如何排查?

在Kubernetes(K8S)中,Pod一直处于Init状态可能由多种原因引起,包括依赖项缺失、资源不足、网络问题或初始化脚本错误等。为了排查Pod一直处于Init状态的问题,可以按照以下步骤进行: 1. 查看Pod状态 首先,使用kubectl get pods命令查看当前所有Pod的状态,特别关注那些状态为"Init"或"Init:0/1"的Pod。 ...

文章 2024-08-24 来自:开发者社区

在K8S中,Pod处于OOM状态如何排查?

在Kubernetes (K8S) 中,Pod处于OOM(Out of Memory)状态意味着Pod因为内存不足而被系统强制终止。这通常发生在Pod尝试使用超过其分配的内存资源时。以下是排查Pod OOM状态的一些步骤: 检查Pod状态:使用kubectl get pods命令来查看Pod的状态。如果Pod处于OOM状态,你会看到状态为OOMKilled。 ...

文章 2024-08-24 来自:开发者社区

在K8S中,突然之间无法访问到Pod,正确的排查思路是什么?

在Kubernetes (K8s) 中,如果突然无法访问到某个Pod,可以按照以下步骤来排查问题: 1. 检查Pod的状态 首先确认Pod的状态是否正常: 使用 kubectl get pods 查看Pod列表及其状态。 使用 kubectl describe pod <pod-name> 获取更详细的Pod信息。 2....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。