文章 2025-03-02 来自:开发者社区

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好

本文转载来源:量子位公众号,一水发自凹非寺,不代表官方立场 GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。 除了数学(第6),还在多个单项上拿下第一: 创意写作; 编程; 指令遵循; 长文本查询; 多轮对话; ...

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
文章 2024-08-21 来自:开发者社区

87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe

近年来,随着大型语言模型(LLMs)的快速发展,如何准确评估这些模型的输出质量变得愈发困难。由于人工评估的成本高昂,自动评估模型(autoraters)的需求日益增长。近日,谷歌DeepMind团队发布了一种名为FLAMe(Foundational Large Autor...

文章 2023-08-08 来自:开发者社区

击败Llama 2,抗衡GPT-3.5,Stability AI新模型登顶开源大模型排行榜

一眨眼,开源大模型又进步了。谷歌、OpenAI真的没有护城河?「我就午休了 30 分钟,我们的领域又变了?」在看到最新的开源大模型排行榜后,一位 AI 领域的创业者发出了灵魂追问。排行榜链接:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard上图红框中的「新秀」是来自 Stability AI 和 CarperAI l....

击败Llama 2,抗衡GPT-3.5,Stability AI新模型登顶开源大模型排行榜

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。