问答 2023-03-27 来自:开发者社区

分机停留在初始化模型阶段,请问modelscope 提供的gpt 3模型无法使用多机多卡微调吗?

请问一下ModelScope加载2.7b gpt 3的模型跑微调任务,采用双机8卡torch.distribute.launch 启动,结果主机可以运行,分机停留在初始化模型阶段,请问modelscope 提供的gpt 3模型无法使用多机多卡微调吗?

文章 2023-03-22 来自:开发者社区

【DSW Gallery】基于ModelScope的中文GPT-3模型(1.3B)的微调训练

直接使用请打开基于ModelScope的中文GPT-3模型(1.3B)的微调训练,并点击右上角 “ 在DSW中打开” 。基于ModelScope的中文GPT-3模型(1.3B)的微调训练GPT-3模型是一个通用的预训练生成模型,使用Transformer的Decoder-only结构,可以用于解决下游各种类型的生成任务,特别是zero-shot生成能力。模型利用大量无监督数据,通过自回归任务进行....

【DSW Gallery】基于ModelScope的中文GPT-3模型(1.3B)的微调训练
问答 2023-01-27 来自:开发者社区

用ModelScope社区里面预训练模型GPT-3 2.7B模型下载再加上一些业务相关数据进行微调?

用ModelScope社区里面预训练模型GPT-3 2.7B模型下载,能都在此基础上加上数据进行再次预训练,再加上一些业务相关数据进行微调?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐