阿里云文档 2024-09-20

如何训练GPT-2模型并生成文本

本文介绍如何使用GPU云服务器,使用Megatron-DeepSpeed框架训练GPT-2模型并生成文本。

文章 2023-05-26 来自:开发者社区

7 Papers & Radios | OpenAI用GPT-4解释GPT-2;Meta开源多感官基础模型

本周重要论文有 Meta AI开源的多感官 AI 基础模型,用图像对齐了所有模态,还有 OpenAI 开始用 AI 解读 AI 的新研究。目录:Language models can explain neurons in language modelsEgoLocate: Real-time Motion Capture, Localization, and Mapping with Spars....

7 Papers & Radios | OpenAI用GPT-4解释GPT-2;Meta开源多感官基础模型
文章 2023-05-22 来自:开发者社区

7 Papers | 超越GPT 3.5的小模型;对ChatGPT摸底考试

本周论文包括2D 图像脑补 3D 人体;亚马逊发布超越 GPT 3.5 的小模型等研究。目录Structure and Content-Guided Video Synthesis with Diffusion Models EVA3D: Compositional 3D Human Generation from 2D Image CollectionsMultimodal Chain-of-....

7 Papers | 超越GPT 3.5的小模型;对ChatGPT摸底考试

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。