阿里云文档 2024-09-20

如何训练GPT-2模型并生成文本

本文介绍如何使用GPU云服务器,使用Megatron-DeepSpeed框架训练GPT-2模型并生成文本。

文章 2023-06-30 来自:开发者社区

语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务

继开源 LLaMA 之后,Meta 在生成式 AI 方向又公布一项重大研究。我们知道,GPT、DALL-E 等大规模生成模型彻底改变了自然语言处理和计算机视觉研究。这些模型可以生成高保真文本或图像,而且它们有个重要特点就是「通才」,可以解决没训过的任务。相比之下,语音生成模型在规模和任务泛化方面一直没有「突破性」成果。今日,Meta 介绍了一种「突破性」的生成式语音系统,它可以合成六种语言的语音....

语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务
文章 2023-05-26 来自:开发者社区

7 Papers & Radios | OpenAI用GPT-4解释GPT-2;Meta开源多感官基础模型

本周重要论文有 Meta AI开源的多感官 AI 基础模型,用图像对齐了所有模态,还有 OpenAI 开始用 AI 解读 AI 的新研究。目录:Language models can explain neurons in language modelsEgoLocate: Real-time Motion Capture, Localization, and Mapping with Spars....

7 Papers & Radios | OpenAI用GPT-4解释GPT-2;Meta开源多感官基础模型

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。