临时暂停GPU Pod部分监控指标采集以避免与性能分析工具冲突
ACS默认开启的GPU设备监控因部分监控指标仅支持单进程独立采集,会与NVIDIA Nsight等性能分析工具产生冲突。这会导致在T4、A10、L20(GN8IS)、P16EN卡型上无法正常采集数据,产生CUPTI或DCGM错误,通过临时暂停部分监控指标采集可解决该问题。
如何通过OSS SDK、ossutil工具实现OSS存储的读写分离
OSS存储卷支持多种客户端,不同客户端对写操作的支持程度不同。通常来说,完备的写操作支持会牺牲部分读性能。因此,数据的读写分离能最大程度避免写操作对读性能的影响,显著提升读多写少场景的数据访问性能。本文介绍在读多写少场景下如何通过不同的OSS存储卷客户端,或OSS SDK、ossutil工具等方式实现数据的读写分离。
mlocate等工具定期对OSS存储卷路径扫描导致OSS挂载点占用
挂载OSS存储卷时,将在ECS节点上产生挂载路径,ECS上的其他进程对挂载点的扫描也会转换为对OSS的请求。部分操作系统默认携带mlocate等软件包,会对ECS节点上的OSS存储卷挂载路径进行定期扫描。扫描期间将占用OSS存储卷挂载路径,造成OSS存储卷无法卸载、应用访问OSS存储卷响应变慢等问题。本文介绍相关问题的解决方案。
使用tcpdump工具进行网络抓包定位问题
本文介绍如何在容器计算服务 ACS(Container Compute Service)中,为工作负载注入集成了tcpdump等网络工具的临时容器,进行网络抓包并排查网络问题。
边缘节点离线运维
在云边场景下,边缘节点可能会因为网络不稳定而处于离线状态。离线的边缘节点如果设置了节点自治,节点上的业务可以不受影响持续运行,但您无法再通过云端控制面对边缘节点上的业务做运维变更。ACK Edge集群提供了边缘节点离线运维工具,用于支持用户在紧急情况下,对离线节点上的业务进行运维操作,例如业务回滚,资源变配,业务配置修改等。本文为您介绍如何使用边缘节点离线运维工具。
Docker容器命令行可视化工具-Lazydocker
Lazydocker的使用背景平时的工作管理中会使用到各种各样的命令行工具,有些人是比较厌烦的去学习各种命令以及选项,比如Docker的各种命令和选项其实都让人很头大,于是就有人做出来一款名为Lazydocker的专为懒人设计的Docker和docker-compose终端管理工具,该工具使用Go语言开发基于gocui实现。如果你发现自己的项目出了问题,或者是服务down掉了,那么Lazydoc....
云服务器使用docker安装portainer容器可视化管理工具
1、涉及到的网址docker安装地址:https://docs.docker.com/engine/install/portainer地址:https://docs.portainer.io/v/ce-2.9/start/install/server/docker/linux2、购买服务器1、登录案例云官网,购买轻量级服务器,或云服务器ECS,如果已购买,忽略此步。系统推荐使用Ubuntu20.....
免费的容器架构可视化工具 | 阿里云应用高可用服务 AHAS 发布重大新特性
工具下载链接:点这里。活动发布链接:点这里。 采用容器服务后,了解容器之间的关系及依赖是一个比较有挑战的问题。容器化改造后的实际架构模型可能与预想的架构存在较大的差异,架构师或系统运维人员需要精确地了解资源实例的构成和交互情况,存在一定的困难。其次,系统架构在动态演化过程中可能引入了一些不可靠的因素,比如弱依赖变强依赖、局部容量不足、系统耦合过重等,给系统的稳定性带了极大的安全隐患。所以我们每次....
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
+关注