阿里云文档 2025-09-17

【组件公告】关于nvidia-container-toolkit引起内存上涨公告

影响说明问题原因:GPU节点上存在频繁调用容器exec操作(例如Pod配置了exec探针),每次调用容器exec操作时,nvidia container runtime会打印info级别的日志。问题原因:影响结果:导致/run/containerd/io.containerd.runtime.v2....

文章 2025-02-28 来自:开发者社区

K8S异常诊断之俺的内存呢

阿里妹导读 本文讲述作者如何解决客户集群中出现的OOM(Out of Memory)和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征,还深入探讨了排查过程中的关键步骤和技术细节。 人在工位坐,锅又双叒叕从天上来: 某日下午,正当我在工位勤恳工作时,我沉寂已久的电话铃声突然响起,刚接起来就听见对面哭喊着:“牧原老哥,救救我啊!”。原来某TAM...

K8S异常诊断之俺的内存呢
文章 2025-02-21 来自:开发者社区

K8S异常诊断之俺的内存呢

1.人在工位坐,锅又双叒叕从天上来: 某日下午,正当我在工位勤恳工作时,我沉寂已久的电话铃声突然响起,刚接起来就听见对面哭喊着:“牧原老哥,救救我啊!”。原来某TAM同学拜访客户,恰逢客户集群多个节点和业务出现OOM以及驱逐pod的情况,需要我们快速救援,那咱必须救兄弟姐妹于金木水火土之中啊 ...

K8S异常诊断之俺的内存呢
文章 2024-11-13 来自:开发者社区

k8s 设置pod 的cpu 和内存

在 Kubernetes (k8s) 中,设置 Pod 的 CPU 和内存资源限制和请求是非常重要的,因为这有助于确保集群资源的合理分配和有效利用。你可以通过定义 Pod 的 resources 字段来设置这些限制。 以下是一个示例 YAML 文件,展示了如何为一个 Pod 设置 CPU 和内存资源请求(requests)和限...

问答 2024-08-27 来自:开发者社区

Chaosblade k8s集群场景下容器内存负载实验,报错是什么原因?

k8s集群场景下容器内存负载实验,报cgroups load failed是什么原因 chaosblade-operator报的错误

文章 2024-08-23 来自:开发者社区

在K8S中,Pod占用内存和cpu较高,该如何解决?

在Kubernetes(K8s)中,当Pod占用内存和CPU较高时,可以通过一系列步骤来诊断并解决问题,以确保集群的稳定性和性能。以下是详细的解决步骤: 1. 监控和诊断 使用kubectl命令: 使用kubectl top pods命令查看集群中各个Pod的CPU和内存占用情况,找出占用资源高的Pod。 使用kubectl describe pod...

问答 2024-06-25 来自:开发者社区

容器服务ACK prome可以看到某个node的pod内存使用率吗?

容器服务ACK prome可以看到某个node的pod内存使用率吗?我没找到呀阿里云prome

问答 2024-06-04 来自:开发者社区

容器服务K8s集群告警内存使用过高后的注意事项

容器服务K8s集群告警内存使用过高后的注意事项

问答 2024-06-01 来自:开发者社区

云监控中主机监控K8s节点内存使用率和容器监控内存使用率不一样

云监控中主机监控K8s节点内存使用率和容器监控内存使用率不一样

问答 2024-05-31 来自:开发者社区

K8S的容器监控中部署应用内存使用量和部署应用工作内存使用量的区别是什么

K8S的容器监控中部署应用内存使用量和部署应用工作内存使用量的区别是什么

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云容器服务 ACK

云端最佳容器应用运行环境,安全、稳定、极致弹性

+关注