文章 2023-08-07 来自:开发者社区

研究实锤GPT-4真变笨了:3个月内数学能力雪崩式下降,代码能力也变差

前些天,有不少用户抱怨 GPT-4 变笨了,但到底变得有多笨呢?近日,来自斯坦福、UC Berkeley 的一篇 arXiv 预印本论文给出了对这一问题的定量实验结果并公布了相关评估和响应数据。在论文公布不久,这篇研究就引起了大家广泛的关注与讨论,很多网友都认同论文阐述的结果。当然,任何事物都有两面...

研究实锤GPT-4真变笨了:3个月内数学能力雪崩式下降,代码能力也变差
文章 2023-06-30 来自:开发者社区

爆火的「GPT-4 MIT本科数学满分」论文作弊,数据集本身有问题

爆火的「GPT-4 MIT本科数学满分」论文作弊,数据集本身有问题机器之心 2023-06-18 13:12 发表于北京机器之心报道编辑:蛋酱结论不应该如此被夸大。这两天,一篇关于 GPT-4 满分通过 MIT EECS 和数学本科考试的论文在推特上疯传。论文地址:https://arxiv.org/pdf/2306.08997.pdf简单...

爆火的「GPT-4 MIT本科数学满分」论文作弊,数据集本身有问题
文章 2023-06-29 来自:开发者社区

OpenAI要为GPT-4解决数学问题了:奖励模型指错,解题水平达到新高度

对于具有挑战性的 step-by-step 数学推理问题,是在每一步给予奖励还是在最后给予单个奖励更有效呢?OpenAI 的最新研究给出了他们的答案。现在,大语言模型迎来了「无所不能」的时代,其中在执行复杂多步推理方面的能力也有了很大提高。不过,即使是最先进的大模型也会产生逻辑错误,通常称为幻觉。因此࿰...

OpenAI要为GPT-4解决数学问题了:奖励模型指错,解题水平达到新高度
文章 2023-05-26 来自:开发者社区

7 Papers | 浙大研究获SIGMOD 2023最佳论文;GPT-4拿下最难数学推理数据集新SOTA

本周论文包括 10% 成本定制专属类 GPT-4 多模态大模型;GPT-4 拿下最难数学推理数据集新 SOTA 等研究。目录:Transfer Visual Prompt Generator across LLMs Progressive-Hint Prompting Improves Reasoning in Large Language ModelsAutoML-...

7 Papers | 浙大研究获SIGMOD 2023最佳论文;GPT-4拿下最难数学推理数据集新SOTA
文章 2023-05-26 来自:开发者社区

GPT-4拿下最难数学推理数据集新SOTA,新型Prompting让大模型推理能力狂升(1)

GPT-4拿下最难数学推理数据集新SOTA,新型Prompting让大模型推理能力狂升机器之心 2023-05-14 12:16 发表于北京机器之心专栏机器之心编辑部模拟人类推理过程,华为诺亚提出 Progressive-Hint Prompting (PHP) 引导大模型渐近正确答案。近期,华为联和港中文发表论文《Progressive-Hint Pr...

GPT-4拿下最难数学推理数据集新SOTA,新型Prompting让大模型推理能力狂升(1)
文章 2023-05-26 来自:开发者社区

GPT-4拿下最难数学推理数据集新SOTA,新型Prompting让大模型推理能力狂升(2)

消融实验将句子 P1 和 P2 纳入模型可以提高 CoT 在三个数据集上的表现,但当使用 Complex CoT 方法时,这两个句子的重要性尤为明显。在加入 P1 和 P2 后,该方法在六个数据集中有五个数据集的表现得到了提升。例如,在 SVAMP 数据集上,Complex CoT 的表现从 78.0% 提高到了 80.0%&...

GPT-4拿下最难数学推理数据集新SOTA,新型Prompting让大模型推理能力狂升(2)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。