使用高性能网络RDMA运行应用
在大规模的AI计算应用中,需要考虑任务间的通信效率,以充分发挥GPU算力的性能。ACK One注册集群接入ACS算力后,提供了低延迟、大吞吐、高弹性的高性能RDMA(Remote Direct Memory Access)网络服务。本文为您介绍如何使用高性能网络RDMA运行应用。
使用高性能网络RDMA运行应用
在大规模的AI计算应用中,需要考虑任务间的通信效率,以充分发挥GPU算力的性能。阿里云容器计算服务 ACS(Container Compute Service)提供了低延迟、大吞吐、高弹性的高性能RDMA(Remote Direct Memory Access)网络服务。本文为您介绍如何使用高性能网络RDMA运行应用。
通过虚拟节点将Pod调度到ACS上运行
容器计算服务 ACS(Container Compute Service)已集成至ACK One注册集群,您可以通过ACK One注册集群快速使用ACS提供的容器算力。本文介绍ACK One注册集群如何接入ACS算力。
遇到一个问题。如果一个pod运行起来以后,这个pod被这个宿主机上日志收集程序。 这个时候,如果我减少这个deployment的副本的话,会导致回收的那个pod的容器的日志进程挂在文件系统,会导致这个容器变成DEAD, pod变成terminating。
遇到一个问题。如果一个pod运行起来以后,这个pod被这个宿主机上日志收集程序。 这个时候,如果我减少这个deployment的副本的话,会导致回收的那个pod的容器的日志进程挂在文件系统,会导致这个容器变成DEAD, pod变成terminating。
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
容器更多运行相关
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
+关注