阿里云文档 2025-03-06

大模型继续预训练解决方案

在人工智能和自然语言处理领域,大语言模型(LLM)已经成为推动技术进步的核心力量。但在实际应用中,针对特定任务或领域的继续预训练往往是提升模型性能的关键。本方案以通义千问2(Qwen2)模型为例,为您介绍如何对模型进行继续预训练。

阿里云文档 2025-02-28

如何在PAI-DLC上使用Megatron-LM进行大语言模型预训练

预训练大语言模型面对来自模型规模和数据规模的多重挑战,为了解决这些问题,PAI提供了在DLC上使用Megatron-LM进行大语言模型预训练的最佳实践。该实践通过准备镜像环境与训练数据、调整训练策略、提交与管理任务等流程,帮助您在DLC上轻松高效地预训练大语言模型。本文为您介绍该实践的使用流程。

问答 2022-06-13 来自:开发者社区

EasyTransfer框架在PAI平台上预训练的PAI-ALBERT-zh取得哪些成绩?

EasyTransfer框架在PAI平台上预训练的PAI-ALBERT-zh取得哪些成绩?

文章 2022-02-17 来自:开发者社区

预训练知识度量比赛夺冠!阿里云PAI发布知识预训练工具

背景阿里云计算平台PAI团队携手达摩院智能对话与服务技术团队,在CCIR Cup2021全国信息检索挑战杯的《预训练模型知识量度量》比赛中基于自研的融入知识预训练模型取得第一名。本赛题主要考查预训练语言模型蕴含的知识量,涉及到九大领域,包括音乐、影视、军事、历史、化学、物理、生物、法律、医学。同时,赛题包含三种不同难度的题目,考查模型对于单跳事实,多跳事实和常识的掌握程度。可以看出,赛题针对预训....

预训练知识度量比赛夺冠!阿里云PAI发布知识预训练工具

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注