临时暂停GPU Pod部分监控指标采集以避免与性能分析工具冲突
ACS默认开启的GPU设备监控因部分监控指标仅支持单进程独立采集,会与NVIDIA Nsight等性能分析工具产生冲突。这会导致在T4、A10、L20(GN8IS)、P16EN卡型上无法正常采集数据,产生CUPTI或DCGM错误,通过临时暂停部分监控指标采集可解决该问题。
如何通过OSS SDK、ossutil工具实现OSS存储的读写分离
OSS存储卷支持多种客户端,不同客户端对写操作的支持程度不同。通常来说,完备的写操作支持会牺牲部分读性能。因此,数据的读写分离能最大程度避免写操作对读性能的影响,显著提升读多写少场景的数据访问性能。本文介绍在读多写少场景下如何通过不同的OSS存储卷客户端,或OSS SDK、ossutil工具等方式实现数据的读写分离。
mlocate等工具定期对OSS存储卷路径扫描导致OSS挂载点占用
挂载OSS存储卷时,将在ECS节点上产生挂载路径,ECS上的其他进程对挂载点的扫描也会转换为对OSS的请求。部分操作系统默认携带mlocate等软件包,会对ECS节点上的OSS存储卷挂载路径进行定期扫描。扫描期间将占用OSS存储卷挂载路径,造成OSS存储卷无法卸载、应用访问OSS存储卷响应变慢等问题。本文介绍相关问题的解决方案。
使用tcpdump工具进行网络抓包定位问题
本文介绍如何在容器计算服务 ACS(Container Compute Service)中,为工作负载注入集成了tcpdump等网络工具的临时容器,进行网络抓包并排查网络问题。
边缘节点离线运维
在云边场景下,边缘节点可能会因为网络不稳定而处于离线状态。离线的边缘节点如果设置了节点自治,节点上的业务可以不受影响持续运行,但您无法再通过云端控制面对边缘节点上的业务做运维变更。ACK Edge集群提供了边缘节点离线运维工具,用于支持用户在紧急情况下,对离线节点上的业务进行运维操作,例如业务回滚,资源变配,业务配置修改等。本文为您介绍如何使用边缘节点离线运维工具。
Docker Compose凭借其简单易用的特性,已经成为开发者在构建和管理多容器应用时不可或缺的工具。
随着微服务架构的普及和容器技术的兴起,Docker已成为开发、部署应用的标准工具。然而,单一容器的应用往往不足以支撑复杂的业务场景,容器间的协作、配置管理及服务编排变得尤为重要。这时,Docker Compose作为一款轻量级的容器编排工具,凭借其简洁的配置文件和强大的功能,成为开发者手中的利器,极...
巨头联手 IBM 和 Google 为开发者推出开源容器安全工具
IBM 正在与 Google 合作,推出一个名为 Grafeas 的新项目。计划提供可用于管理和保护软件供应链的元数据中心。 本周四,谷歌和 IBM 推出了一个名为 Grafeas 的开源项目,用于收集和汇总特定的元数据,开发者可用来保护其软件。项目的目标是在即使由微服务器和容器带来的“供应链”缩短情况下,仍能帮助开发者保持其项目的安全标准。 Google 一直在构建 Grafeas 作为容器.....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
+关注