问答 2023-11-12 来自:开发者社区

机器学习PAIEasyRec在CPU服务器上分布式训练怎么配,知道吗?

机器学习PAIEasyRec在CPU服务器上分布式训练怎么配,有大佬知道吗?环境变量导入TF_CONFIG就行哈?

阿里云文档 2023-11-03

AI加速:使用TorchAcc实现ResNet-50模型分布式训练加速

阿里云PAI为您提供了部分典型场景下的示例模型,便于您便捷地接入TorchAcc进行训练加速。本文为您介绍如何在ResNet-50分布式训练中接入TorchAcc并实现训练加速。

阿里云文档 2023-11-03

AI加速:使用TorchAcc实现Bert模型分布式训练加速

阿里云PAI为您提供了部分典型场景下的示例模型,便于您便捷地接入TorchAcc进行训练加速。本文为您介绍如何在BERT-Base分布式训练中接入TorchAcc并实现训练加速。

阿里云文档 2023-11-03

AI加速:使用TorchAcc实现Swin Transformer模型分布式训练加速

阿里云PAI为您提供了部分典型场景下的示例模型,便于您便捷地接入TorchAcc进行训练加速。本文为您介绍如何在Swin Transformer分布式训练中接入TorchAcc并实现训练加速。

问答 2023-10-22 来自:开发者社区

机器学习PAI DLC训练任务中,节点设置中设置多个节点,是用来分布式训练吗?

机器学习PAI DLC训练任务中,节点设置中设置多个节点,是用来分布式训练吗?

问答 2023-10-04 来自:开发者社区

使用机器学习平台PAI,怎么创建deepspeed的分布式训练?

使用机器学习平台PAI,怎么创建deepspeed的分布式训练我搜文档只搜到可视化建模的EasyRec案例,咱们DLC有没有支持 deepspeed,有没有相关的案例呀 ?

问答 2023-08-27 来自:开发者社区

想尝试用机器学习PAI的EasyRec官方docker得到下图报错?

想尝试用机器学习PAI的EasyRec官方docker通过PAI-DLC在Hive上做分布式训练测试,得到下图报错?

问答 2023-07-31 来自:开发者社区

机器学习PAI使用DeepRec运行estimator分布式训练,protocol 使用star_?

$stringUtil.substring( $!{XssContent1.description},200)...

问答 2023-06-05 来自:开发者社区

机器学习PAI在easyrec里自定义了一些逻辑,pai上做分布式训练的时候如何让这个第三方包生效?

机器学习PAI在easyrec里自定义了一些逻辑,引用了第三方包,在pai上做分布式训练的时候如何让这个第三方包生效啊?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注