临时暂停GPU Pod部分监控指标采集以避免与性能分析工具冲突
ACS默认开启的GPU设备监控因部分监控指标仅支持单进程独立采集,会与NVIDIA Nsight等性能分析工具产生冲突。这会导致在T4、A10、L20(GN8IS)、P16EN卡型上无法正常采集数据,产生CUPTI或DCGM错误,通过临时暂停部分监控指标采集可解决该问题。
如何通过OSS SDK、ossutil工具实现OSS存储的读写分离
OSS存储卷支持多种客户端,不同客户端对写操作的支持程度不同。通常来说,完备的写操作支持会牺牲部分读性能。因此,数据的读写分离能最大程度避免写操作对读性能的影响,显著提升读多写少场景的数据访问性能。本文介绍在读多写少场景下如何通过不同的OSS存储卷客户端,或OSS SDK、ossutil工具等方式实现数据的读写分离。
mlocate等工具定期对OSS存储卷路径扫描导致OSS挂载点占用
挂载OSS存储卷时,将在ECS节点上产生挂载路径,ECS上的其他进程对挂载点的扫描也会转换为对OSS的请求。部分操作系统默认携带mlocate等软件包,会对ECS节点上的OSS存储卷挂载路径进行定期扫描。扫描期间将占用OSS存储卷挂载路径,造成OSS存储卷无法卸载、应用访问OSS存储卷响应变慢等问题。本文介绍相关问题的解决方案。
使用tcpdump工具进行网络抓包定位问题
本文介绍如何在容器计算服务 ACS(Container Compute Service)中,为工作负载注入集成了tcpdump等网络工具的临时容器,进行网络抓包并排查网络问题。
边缘节点离线运维
在云边场景下,边缘节点可能会因为网络不稳定而处于离线状态。离线的边缘节点如果设置了节点自治,节点上的业务可以不受影响持续运行,但您无法再通过云端控制面对边缘节点上的业务做运维变更。ACK Edge集群提供了边缘节点离线运维工具,用于支持用户在紧急情况下,对离线节点上的业务进行运维操作,例如业务回滚,资源变配,业务配置修改等。本文为您介绍如何使用边缘节点离线运维工具。
下一代容器工具 Podman 与 Docker 的比较
Linux Container 简介Linux Container (容器)是与系统其他部分隔离开的一系列进程。运行这些进程所需的所有文件都由另一个镜像提供,这意味着从开发到测试再到生产的整个过程中,Linux 容器都具有可移植性和一致性。因而,相对于依赖重复传统测试环境的开发渠道,容器的运行速度要快得多。容器比较普遍也易于使用,因此也成了 IT 安全方面的重要组成部分。容器可以确保您的应用拥有....
我们下一代的 Linux 容器工具:Podman
Podman Overview文章目录Podman Overview1. 什么是 Podman?2. 使用 Podman 的多种方式Podman是一个构建容器的工具。它与Docker扮演相同的角色,并且在很大程度上与 Docker 兼容,提供几乎相同的命令。本文为开始使用 Podman 的开发人员和寻求更高级信息的开发人员提供了资源。1. 什么是 Podman?我们发现以下视频和文章是很好的起点....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
+关注