阿里云文档 2025-03-06

大模型继续预训练解决方案

在人工智能和自然语言处理领域,大语言模型(LLM)已经成为推动技术进步的核心力量。但在实际应用中,针对特定任务或领域的继续预训练往往是提升模型性能的关键。本方案以通义千问2(Qwen2)模型为例,为您介绍如何对模型进行继续预训练。

阿里云文档 2025-02-28

如何在PAI-DLC上使用Megatron-LM进行大语言模型预训练

预训练大语言模型面对来自模型规模和数据规模的多重挑战,为了解决这些问题,PAI提供了在DLC上使用Megatron-LM进行大语言模型预训练的最佳实践。该实践通过准备镜像环境与训练数据、调整训练策略、提交与管理任务等流程,帮助您在DLC上轻松高效地预训练大语言模型。本文为您介绍该实践的使用流程。

问答 2024-07-26 来自:开发者社区

阿里PAI支持哪些大模型的预训练?

阿里PAI支持哪些大模型的预训练?

文章 2024-06-26 来自:开发者社区

大模型训练的艺术:从预训练到增强学习的四阶段之旅

大模型训练的艺术:从预训练到增强学习的四阶段之旅 在当今人工智能领域,大型模型以其卓越的性能和广泛的应用前景,成为推动技术进步的重要力量。训练这样复杂的模型并非一日之功,而是需历经精心设计的四个阶段:预训练、监督微调(SFT...

大模型训练的艺术:从预训练到增强学习的四阶段之旅
文章 2024-06-11 来自:开发者社区

人工智能平台PAI产品使用合集之Alink是否加载预训练好的pytorch模型

问题一:请问机器学习PAI在dsw中如何将文件存储到nas? 请问机器学习PAI在dsw中如何将文件存储到nas? 参考回答: 在机器学习PAI的DSW中,如果您需要将文件存储到NAS,首先需要创建NAS类型的数据集。随后,将这个数据集挂载到DSW指定的路径下,就可以在DSW中读写NAS中的数据集数据。此外,DSW实例默认提供的系统盘为临时存储,如果需...

人工智能平台PAI产品使用合集之Alink是否加载预训练好的pytorch模型
问答 2023-12-12 来自:开发者社区

请问机器学习PAI的Alink可以加载预训练好的pytorch模型嘛?

请问Alink可以加载预训练好的pytorch模型嘛?

文章 2023-05-16 来自:开发者社区

大模型训练之难,难于上青天?预训练易用、效率超群的「李白」模型库来了!(2)

LiBai 支持所有常见并行训练策略分布式训练大模型是个复杂问题,涉及到数据并行(data parallel),模型并行(tensor/model parallel),流水并行(pipeline parallel)等多种并行策略,LiBai 模型库支持这三种常见的并行策略以及这些并行策略的任意组合(并行策略的基本概念:https://docs.oneflow.org/master/paralle....

大模型训练之难,难于上青天?预训练易用、效率超群的「李白」模型库来了!(2)
文章 2023-05-16 来自:开发者社区

大模型训练之难,难于上青天?预训练易用、效率超群的「李白」模型库来了!(1)

LiBai(李白)模型库覆盖了 Hugging Face、Megatron-LM、DeepSpeed、FairSeq 这些所有主流 Transformer 库的优点,让大模型训练飞入寻常百姓家。大模型多了去了,告诉我怎么加速?自 2018 年 BERT 诞生,到 GPT-3、ViT 等拥有数以亿计的参数规模的模型不断涌现,AI 模型参数量的爆发式增长已不足为奇,让炼丹师无暇顾及甚至感到麻木。与此....

大模型训练之难,难于上青天?预训练易用、效率超群的「李白」模型库来了!(1)
问答 2022-06-13 来自:开发者社区

EasyTransfer框架在PAI平台上预训练的PAI-ALBERT-zh取得哪些成绩?

EasyTransfer框架在PAI平台上预训练的PAI-ALBERT-zh取得哪些成绩?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注