[帮助文档] 创建DLC任务时启用容错监控功能_人工智能平台 PAI(PAI)

本文为您介绍如何使用DLC提供的基于AIMaster的容错监控功能。

[帮助文档] 分布式训练DLC 算力健康检测发布_人工智能平台 PAI(PAI)

支持对训练任务的资源健康度与性能进行检查,提升训练成功率及问题诊断效率。

高校精品课-复旦大学-机器学习与深度学习

1 课时 |
105 人已学 |
免费

PAI平台学习路线:机器学习入门到应用

52 课时 |
685 人已学 |
免费

场景实践 - 机器学习PAI实现精细化营销

7 课时 |
138 人已学 |
免费
开发者课程背景图

[帮助文档] 通用计算资源计费详情_人工智能平台 PAI(PAI)

通用计算资源的计费项由公共资源组和专有资源组组成。本文为您介绍通用计算资源各个资源组的计费详情。

[帮助文档] 如何在PAI-DLC上使用Megatron-LM进行大语言模型预训练_人工智能平台 PAI(PAI)

预训练大语言模型面对来自于模型规模和数据规模的多重挑战,为了解决这些问题,PAI提供了在DLC上使用Megatron-LM进行大语言模型预训练的最佳实践。该实践通过准备镜像环境与训练数据、调整训练策略、提交与管理任务等流程,帮助您在DLC上轻松高效地预训练大语言模型。本文为您介绍该实践的使用流程。

[帮助文档] 提交dlc任务使用闲时共享资源

本文为您介绍如何在使用预付费资源配额(Quota)提交DLC训练任务时,合理利用并配置闲时资源。

机器学习PAI 目前卡在数据和dlc任务执行上,该怎么解决这个问题呢?

机器学习PAI需求是跑通上面的deepfm示例的训练任务部署 目前卡在数据和dlc任务执行上,该怎么解决这个问题呢?

机器学习PAI中学习启动一个dlc训练任务,最后报错 pai not found,该怎么解决?

机器学习PAI中学习启动一个dlc训练任务,用的pai平台镜像执行命令改了我的bucket, 最后报错 pai not found,该怎么解决这个问题?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

阿里云机器学习平台PAI
阿里云机器学习平台PAI
阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。
2435+人已加入
加入
相关电子书
更多
人工智能平台PAI的MaaS实践
阿里云PAI模型服务 开启AIGC创新之旅
PAI灵骏智算 构建全链路LLM服务的最佳实践
立即下载 立即下载 立即下载