文章 2025-05-14 来自:开发者社区

全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源

01.前言 OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。 开源的MLLMs和扩散模型已经过大规模预训练,其从零开始训练统一任务,不如取长补短,将MLLMs的语言建模能力,与扩散模型的像素级图像建模能力,进行有机的结合。 基于这个思路,ModelScope团队提出可同时完成图像理解、生成和编辑的统一...

全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源
文章 2025-04-04 来自:开发者社区

SWEET-RL:8B小模型暴打GPT-4?Meta开源强化学习黑科技,多轮任务成功率飙升6%

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术! AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 "8B小模型暴打GPT-4?Meta开源强化学习黑科技...

SWEET-RL:8B小模型暴打GPT-4?Meta开源强化学习黑科技,多轮任务成功率飙升6%
文章 2024-10-19 来自:开发者社区

华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

大型语言模型(LLM)的功能调用能力在近年来受到了广泛关注。通过功能调用,LLM的应用边界得到了显著扩展。然而,高质量、多样化的训练数据对于LLM功能调用能力的培养至关重要。现实中,功能调用数据的收集和标注非常具有挑战性,而现有流水线生成的合成数据往往覆盖不全、准确性不足。 为了解决上述问题,华为诺...

阿里云文档 2024-09-20

如何训练GPT-2模型并生成文本

本文介绍如何使用GPU云服务器,使用Megatron-DeepSpeed框架训练GPT-2模型并生成文本。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。