文章 2025-01-22 来自:开发者社区

DeepSeek 开源 R1 系列推理模型,性能对标 OpenAI o1,基于纯强化学习完成自我进化,无需监督微调

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 高性能推理:DeepSeek-R1 在数学、代码和自然语言推理等任务中表现出色,性能对标 OpenAI o1。 强化学习与自我进化:通过大规模强化学习和极少...

DeepSeek 开源 R1 系列推理模型,性能对标 OpenAI o1,基于纯强化学习完成自我进化,无需监督微调
文章 2024-04-20 来自:开发者社区

[译][AI OpenAI-doc] 微调

学习如何为您的应用程序定制模型。介绍微调允许您通过提供以下内容,从 API 提供的模型中获得更多收益:比提示更高质量的结果能够训练比提示中能容纳的更多示例由于提示更短而节省的标记更低的延迟请求OpenAI 的文本生成模型已经在大量文本上进行了预训练。为了有效地使用这些模型,我们在提示中包含了说明和有时几个示例。使用示例来展示如何执行任务通常被称为 "少样本学习"。微调通过在比提示中可以容纳的更多....

[译][AI OpenAI-doc] 微调
问答 2024-03-12 来自:开发者社区

想用 ModelScope的openai在线微调gpt-4v,怎么用图片做数据集?

想用 ModelScope的openai在线微调gpt-4v,怎么用图片做数据集?

文章 2023-10-14 来自:开发者社区

2023年8月22日OpenAI推出了革命性更新:ChatGPT-3.5 Turbo微调和API更新,为您的业务量身打造AI模型

博主猫头虎 带您 Go to New World.✨ 博客首页——猫头虎的博客《面试题大全专栏》 文章图文并茂生动形象简单易学!欢迎大家来踩踩~ 《IDEA开发秘籍专栏》学会IDEA常用操作,工作效率翻倍~ 《100天精通Golang(基础入门篇)》学会Golang语言,畅玩云原生,走遍大小厂~ 希望本文能够给您带来一定的帮助文章粗浅,敬请批评指正!ChatGPT-3.5 Turbo微调功能及.....

2023年8月22日OpenAI推出了革命性更新:ChatGPT-3.5 Turbo微调和API更新,为您的业务量身打造AI模型

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。