阿里云文档 2024-09-24

使用eRDMA网络进行分布式训练

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA)是阿里云自研的云上弹性RDMA网络。PAI通用计算资源中的部分GPU机型已支持eRDMA能力,您只需使用特定镜像提交基于这些GPU机型的DLC任务,系统将自动在容器内挂载eRDMA网卡,从而加速分布式训练过程。

阿里云文档 2024-09-11

通过PAI - 灵骏分布式训练和部署Llama 2模型

灵骏支持业界各类流行的开源大语言模型,包括Llama2系列、Bloom系列、Falcon系列、GLM/ChatGLM系列,以及领域大模型galactica等的高效训练和部署。本方案整体可用于企业样本标注、创意文本生成、智能对话助手、文本类创作辅助等场景。

阿里云文档 2024-08-29

快速提交Slurm类型的DLC任务

本文为您介绍如何提交Slurm类型的训练任务。

问答 2024-08-14 来自:开发者社区

机器学习PAI这边北京训练的模型使用了北京的镜像,现在要部署到张家口的EAS,拉取不到跟北京一样的镜

机器学习PAI这边北京训练的模型使用了北京的镜像,现在要部署到张家口的EAS,拉取不到跟北京一样的镜像,这个问题怎么解决啊?张家口部署是因为flink, hologres等服务都在张家口, 推理服务想离数据源近些

阿里云文档 2024-07-08

图像生成训练

图像生成训练算法提供主流的GAN模型训练功能,用于图像生成。通过对原始图片素材进行训练,支持DCGAN、WGAN-GP、LSGAN、GGAN、PGGAN和StyleGAN图像生成模型网络,可生成高质量和多样化的图像生成模型。

阿里云文档 2024-07-08

MLP回归的训练过程

MLP(Multilayer Perceptron,多层感知器)回归是一种基于神经网络的回归算法,主要用于解决非线性回归问题。它通过多个隐藏层将输入特征映射到输出,能够捕捉复杂的模式和关系。MLP回归的训练过程涉及前向传播、损失计算、反向传播及参数更新的多个步骤,通过这些步骤模型可以逐渐学习并优化,从而准确预测输出结果。

问答 2024-05-16 来自:开发者社区

请教一下机器学习PAI用dlc跑easyrec训练应该用哪个镜像呀?

请教一下机器学习PAI用dlc跑easyrec训练应该用哪个镜像呀?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注