AI通信加速库DeepNCCL的架构、性能以及优化原理
DeepNCCL是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍DeepNCCL的架构、优化原理和性能说明。
阿里云上稳定性保障服务(架构优化)
1. 服务概述根据客户的业务需求,从云资产和应用架构的角度帮助客户进行巡检,主动发现潜在风险,提供优化方案建议。2. 服务范围服务范围包含: 阿里云服务与产品功能、云上架构的咨询、使用、配置,提供最佳实践。 与阿里云资源相关的操作或系统问题的技术指导。 与阿里云的管理控制台或其他阿里云官方工具相关的...
现代英特尔® 架构上的 TensorFlow* 优化——正如去年参加Intel AI会议一样,Intel自己提供了对接自己AI CPU优化版本的Tensorflow,下载链接见后,同时可以基于谷歌官方的tf版本直接编译生成安装包
现代英特尔® 架构上的 TensorFlow* 优化 转自:https://software.intel.com/zh-cn/articles/tensorflow-optimizations-on-modern-intel-architecture 英特尔:Elmoustapha Ould-Ahmed-Vall,Mahmoud Abuzaina,Md Faijul Amin,Jayara...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
架构更多优化相关
金融级分布式架构
SOFAStack™(Scalable Open Financial Architecture Stack)是一套用于快速构建金融级分布式架构的中间件,也是在金融场景里锤炼出来的最佳实践。
+关注