阿里云文档 2024-09-20

如何训练GPT-2模型并生成文本

本文介绍如何使用GPU云服务器,使用Megatron-DeepSpeed框架训练GPT-2模型并生成文本。

文章 2024-09-07 来自:开发者社区

【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……

本文内容均由【通义】自动生成,打开通义官网,更多能力等你体验~ 24小时精选 ✦ 性能超越GPT-4o?最强大的开源AI模型来了 智谱清言App视频通话功能限时免费开放 一款能诊断癌症的AI模型!哈佛医学院研发CHIEF Replit推出AI编程助手,0基础也可以开发应用 英特尔携手日本AIST开设芯片制造研发中心 ...

文章 2024-08-10 来自:开发者社区

长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙

近年来,大型语言模型(LLM)的上下文处理能力得到了显著提升。然而,最近一项研究却对这些模型在处理长上下文任务时的实际表现提出了质疑。这篇论文的作者们设计了一个名为NoCha的挑战,旨在评估LLM在处理长达一本书长度的文本时,是否能够真正理解和推理其中的信息。 NoCha是一个包含1001对关于67本最近出版的英...

文章 2024-03-19 来自:开发者社区

GPT-SoVits:刚上线两天就获得了1.4k star的开源声音克隆项目!效果炸裂的跨语言音色克隆模型!

就在两天前,RVC变声器创始人 (GitHub昵称:RVC-Boss)开源了一款跨语言音色克隆项目 GPT-SoVITS。项目一上线就引来了互联网大佬和博主的好评推荐,不到两天时间就已经在GitHub上获得了1.4k Star量。 据说,该项目是RVC-Boss 同Rcell (AI音色转换技术Sovits开发者)共同研究,历时半年,期间遇到了很多难题而开发出来的一款全新的低成...

GPT-SoVits:刚上线两天就获得了1.4k star的开源声音克隆项目!效果炸裂的跨语言音色克隆模型!
文章 2023-05-26 来自:开发者社区

7 Papers & Radios | OpenAI用GPT-4解释GPT-2;Meta开源多感官基础模型

本周重要论文有 Meta AI开源的多感官 AI 基础模型,用图像对齐了所有模态,还有 OpenAI 开始用 AI 解读 AI 的新研究。目录:Language models can explain neurons in language modelsEgoLocate: Real-time Motion Capture, Localization, and Mapping with Spars....

7 Papers & Radios | OpenAI用GPT-4解释GPT-2;Meta开源多感官基础模型
文章 2023-05-25 来自:开发者社区

300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了

OpenAI 的强大模型们,被开源社区复刻得差不多了。过去几个月,OpenAI 的 ChatGPT 彻底改变了聊天机器人领域的格局,也成为其他研究赶超的对象。以 Meta 开源 LLaMA(直译为「大羊驼」)系列模型为起点,斯坦福大学等机构的研究人员先后在其上进行「二创」,开源了基于 LLaMA 的 Alpaca(羊驼)、Alpaca-Lora、Luotuo(骆驼)等轻量级类 ChatGPT 模....

300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了
文章 2022-01-13 来自:开发者社区

莆田版GPT-3开源:同等复现预训练模型GPT Neo,可在Colab上完成微调

 新智元报道  来源:Eleuther AI编辑:小匀【新智元导读】 GPT-3开源了?Eleuther AI推出的名为GPT-Neo的开源项目:公开发布的GPT-3同等复现预训练模型(1.3B & 2.7B),可在Colab上完成微调。 ……当然此 GPT-3非彼 GPT-3。 近日,Eleuther AI在GitHub上推出了一个名为GPT-N....

莆田版GPT-3开源:同等复现预训练模型GPT Neo,可在Colab上完成微调
文章 2019-06-26 来自:开发者社区

超越 BERT 和 GPT,微软亚洲研究院开源新模型 MASS!

雷锋网 AI 科技评论按:自 2018 年以来,预训练无疑是自然语言处理(NLP)领域中最热门的研究课题之一。通过利用 BERT、GPT 和 XLNet 等通用语言模型,该领域的研究者们在自然语言理解方面已经取得了许多重大的突破。然而,对于序列到序列的自然语言生成任务,这些主流的预训练方法并没有带来显著的改进,对此,微软亚洲研究院提出了一个全新的通用预训练方法——MASS,在该任务中可以得到比 ....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。