使用高性能网络RDMA运行应用
在大规模的AI计算应用中,需要考虑任务间的通信效率,以充分发挥GPU算力的性能。ACK One注册集群接入ACS算力后,提供了低延迟、大吞吐、高弹性的高性能RDMA(Remote Direct Memory Access)网络服务。本文为您介绍如何使用高性能网络RDMA运行应用。
使用高性能网络RDMA运行应用
在大规模的AI计算应用中,需要考虑任务间的通信效率,以充分发挥GPU算力的性能。阿里云容器计算服务 ACS(Container Compute Service)提供了低延迟、大吞吐、高弹性的高性能RDMA(Remote Direct Memory Access)网络服务。本文为您介绍如何使用高性能网络RDMA运行应用。
使用eRDMA网络进行分布式训练
弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA)是阿里云自研的云上弹性RDMA网络。PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。
基于Reactor模式的高性能网络库之缓冲区Buffer组件
Buffer 类用于处理 socket 的 I/O 缓存 —— 负责: 从 socket 读取数据(read) 写入 socket 发送数据(write) 管理数据区的结构与索引,以避免频繁内存拷贝 成员变量 static c...
基于Reactor模型的高性能网络库之Poller(EpollPoller)组件
封装底层 I/O 多路复用机制(epoll )的 抽象类 Poller Poller 是一个抽象基类(有纯虚函数)。 功能 说明...
基于Reactor模型的高性能网络库之核心调度器:EventLoop组件
它负责:监听事件(如 I/O 可读写、定时器)、分发事件、执行回调、管理事件源 Channel 等。 1. 负责 I/O 多路复用(epoll 等)事件的监听与分发 持有一个 Poller(如 EpollPoller)对象。 循环调用 poll() 等待所有注册的 Channel 的事件(如:可读、可写、关闭等)。 事件触发后,调用 ...
基于Reactor模型的高性能网络库之Channel组件篇
Channel 是事件通道,它绑定某个文件描述符 fd,注册感兴趣的事件(如读/写),并在事件发生时分发给对应的回调函数。 const int Channel::KNoneEvent=0;//用于表示该 Channel 的 fd 没有注册到 epoll 中...
阿里云公告:RDS SQL Server 2008 R2高性能本地盘实例专有网络VPC下线
背景信息为提升用户产品使用体验,确保云服务的稳定和性能,自2024年11月01日起,RDS SQL Server 2008 R2高性能本地盘实例将不再支持专有网络VPC。为确保您业务持续稳定,避免应用和业务可能会面临的各种风险,建议您尽快针对开启了专有网络VPC的RDS SQL Server 200...
基于属性标签将应用调度到高性能网络GPU型虚拟节点上
在使用GPU-HPN预留资源运行应用时,可以基于虚拟节点中的GPU属性标签,将应用调度至目标节点。本文介绍GPU-HPN虚拟节点属性标签基本信息,以及如何将应用部署和运行在指定卡型上。
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。