阿里云文档 2026-03-06

ACK集群节点初始化流程介绍

ACK提供稳定、高效、可预测的节点管理能力。无论是创建新节点还是对已有节点池进行扩容,ACK都遵循一套标准化的初始化流程,按照节点池的配置完成软件安装和配置,加入到Kubernetes集群中。

阿里云文档 2026-03-06

关于使用Terway时部分Linux节点偶发CPU利用率异常升高问题的公告

受Linux社区内核补丁对eBPF程序的影响,若集群使用了Terway容器网络插件,并开启了基于eBPF技术的DataPath V2 (含开启NetworkPolicy)功能,可能出现节点CPU利用率偶发异常升高的情况。

阿里云文档 2025-12-29

Pod在灵骏节点使用RDMA网络

本文档介绍如何在ACK托管集群Pro版的灵骏节点中配置和使用RDMA(RemoteDirect Memory Access)技术,实现高性能容器网络通信。RDMA技术可显著降低网络延迟并提升吞吐量,适用于高性能计算(HPC)、AI训练、分布式存储等对网络性能要求严苛的场景。

阿里云文档 2025-10-17

为GPU应用配置节点自动伸缩

在进行AI模型训练、推理或科学计算等GPU计算密集型任务时,工作负载常呈现显著波动,同时GPU硬件成本较高。通过为集群创建支持自动伸缩的GPU节点池,可根据实际资源需求动态增减节点数量,实现按需使用与弹性调度,有效提升GPU资源利用率并降低运维成本。

阿里云文档 2025-09-25

ACK集群节点Kubelet版本一致性检测

检测ACK集群巡检中的“节点Kubelet组件版本落后于控制面”风险项。当此巡检项无风险时,视为“合规”。规则通过获取最后一次巡检报告结果作为检测依据,如果集群未开通巡检配置评估为“不适用”。

文章 2020-03-27 来自:开发者社区

K8S从懵圈到熟练:读懂这一篇,集群节点不下线

作者:shengdong 排查完全陌生的问题,完全不熟悉的系统组件,是售后工程师的一大工作乐趣,当然也是挑战。今天借这篇文章,跟大家分析一例这样的问题。排查过程中,需要理解一些自己完全陌生的组件,比如systemd和dbus。但是排查问题的思路和方法基本上还是可以复用了,希望对大家有所帮助。 问题一直在发生 I'm NotReady 阿里云有自己的Kubernetes容器集群产品。随着Kuber....

K8S从懵圈到熟练:读懂这一篇,集群节点不下线
文章 2020-03-25 来自:开发者社区

K8S从懵圈到熟练 - 节点下线姊妹篇

作者:shengdong 之前分享过一例集群节点NotReady的问题。在那个问题中,我们的排查路劲,从K8S集群到容器运行时,再到sdbus和systemd,不可谓不复杂。那个问题目前已经在systemd中做了修复,所以基本上能看到那个问题的几率是越来越低了。 但是,集群节点就绪问题还是有的,然而原因却有所不同。 今天这篇文章,跟大家分享另外一例集群节点NotReady的问题。这个问题和之前那....

K8S从懵圈到熟练 - 节点下线姊妹篇
文章 2019-04-29 来自:开发者社区

K8S 从懵圈到熟练:读懂此文,集群节点不下线!

阿里妹导读:排查完全陌生的问题、不熟悉的系统组件,对许多工程师来说是无与伦比的工作乐趣,当然也是一大挑战。今天,阿里巴巴售后技术专家声东跟大家分享一例 Kubernetes 集群上的问题。这个问题影响范围较广,或许某天你也会遇到。更重要的是,作者在问题排查过程中的思路和方法,也会让你有所启发。 关于问题 I am Not Ready 阿里云有自己的 Kubernetes 容器集群产品。随着 Ku....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。