使用高性能网络RDMA运行应用
在大规模的AI计算应用中,需要考虑任务间的通信效率,以充分发挥GPU算力的性能。阿里云容器计算服务 ACS(Container Compute Service)提供了低延迟、大吞吐、高弹性的高性能RDMA(Remote Direct Memory Access)网络服务。本文为您介绍如何使用高性能网络RDMA运行应用。
使用高性能网络RDMA运行应用
在大规模的AI计算应用中,需要考虑任务间的通信效率,以充分发挥GPU算力的性能。ACK One注册集群接入ACS算力后,提供了低延迟、大吞吐、高弹性的高性能RDMA(Remote Direct Memory Access)网络服务。本文为您介绍如何使用高性能网络RDMA运行应用。
通过虚拟节点将Pod调度到ACS上运行
容器计算服务 ACS(Container Compute Service)已集成至ACK One注册集群,您可以通过ACK One注册集群快速使用ACS提供的容器算力。本文介绍ACK One注册集群如何接入ACS算力。
在Docker容器中,有时候无法监控到正在运行的进程
在Docker容器中,有时候无法监控到正在运行的进程,并且启动容器时也没有报找不到进程的错误提示。 这可能是由于一些原因导致的。以下是一些可能的原因和解决方法: 容器内没有正确安装监控工具:如果要在Docker容器中监控进程,首先需要确保安装了适当的监控工具。例如,可以使用ps命令来查看正在运行的进程。确保在Do...
机器学习PAI并行度设置为1,容器运行java进程因为OOM被自动杀掉,除了增大内存还有别的办法吗?
在机器学习PAI并行度设置为1,容器运行java进程因为OOM被自动杀掉,这个除了增大内存,还有别的办法吗?因为搞机器配额比较麻烦。
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
容器更多运行相关
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
+关注