阿里云文档 2026-03-06

ACK集群节点初始化流程介绍

ACK提供稳定、高效、可预测的节点管理能力。无论是创建新节点还是对已有节点池进行扩容,ACK都遵循一套标准化的初始化流程,按照节点池的配置完成软件安装和配置,加入到Kubernetes集群中。

阿里云文档 2026-03-06

关于使用Terway时部分Linux节点偶发CPU利用率异常升高问题的公告

受Linux社区内核补丁对eBPF程序的影响,若集群使用了Terway容器网络插件,并开启了基于eBPF技术的DataPath V2 (含开启NetworkPolicy)功能,可能出现节点CPU利用率偶发异常升高的情况。

阿里云文档 2025-12-29

Pod在灵骏节点使用RDMA网络

本文档介绍如何在ACK托管集群Pro版的灵骏节点中配置和使用RDMA(RemoteDirect Memory Access)技术,实现高性能容器网络通信。RDMA技术可显著降低网络延迟并提升吞吐量,适用于高性能计算(HPC)、AI训练、分布式存储等对网络性能要求严苛的场景。

阿里云文档 2025-10-17

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2025-09-25

ACK集群节点Kubelet版本一致性检测

检测ACK集群巡检中的“节点Kubelet组件版本落后于控制面”风险项。当此巡检项无风险时,视为“合规”。规则通过获取最后一次巡检报告结果作为检测依据,如果集群未开通巡检配置评估为“不适用”。

文章 2024-08-23 来自:开发者社区

在K8S中,集群内有个节点not ready,如何排查?

在Kubernetes(K8s)集群中,如果有一个节点处于"Not Ready"状态,这可能意味着该节点无法接受新的工作负载或存在其他问题。具体分析如下: 检查节点状态 使用基本命令查看节点状态:需要确认节点确实处于“未就绪”状态。使用kubectl get nodes命令可以列出所有节点的状态。例如,您可能会看到以下输出: ...

文章 2024-08-19 来自:开发者社区

在K8S中,节点状态notReady如何排查?

在 Kubernetes (K8s) 集群中,当一个节点(Node)的状态变为NotReady时,意味着该节点可能无法运行Pod或不能正确响应Kubernetes控制平面。排查NotReady节点通常涉及以下步骤: 1. 获取基本信息 使用 kubectl 命令行工具获取节点状态: ...

文章 2022-02-17 来自:开发者社区

记一次JAVA进程导致Kubernetes节点CPU飙高的排查与解决

记一次JAVA进程导致Kubernetes节点CPU飙高的排查与解决 一、发现问题在一次系统上线后,我们发现某几个节点在长时间运行后会出现CPU持续飙升的问题,导致的结果就是Kubernetes集群的这个节点会把所在的Pod进行驱逐(调度);如果调度到同样问题的节点上,也会出现Pod一直起不来的问题。我们尝试了杀死Pod后手动调度的办法(label),当然也可以排除调度节点。但是在一段时间后还会....

问答 2022-02-15 来自:开发者社区

我的机器部署的k8s,今天发现几乎所有的节点最近几个月内存占用率都一直处于上升趋势,排查后发现是 s

我的机器部署的k8s,今天发现几乎所有的节点最近几个月内存占用率都一直处于上升趋势,排查后发现是 slab占用内存了,而且是slab中的SUnreclaim(不可回收)占用的最多,请教这个问题怎么处理 本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。 点击这里 欢迎加入感兴趣的技术领域群

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。