GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

明敏 2024-04-12 21:43:57 来源：量子位

新版本GPT-4 Turbo大提升，ChatGPT用户可直接体验

明敏发自凹非寺

量子位 | 公众号 QbitAI

啥？

新版GPT-4是在Q*的输出上微调的？

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

在竞技场重回榜一的新版GPT-4 Turbo，成功再次踩中大家嗨点。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

它此次的性能提升体现在数学、推理、代码上，而且输出内容废话更少。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

最让大家感到兴奋的是其数学/推理能力，现在可以在一些问题上完胜其他大模型。

比如“求y=x^4-5x^2-x+4和y=x^2-3x交点的y坐标之和。”只有最新版GPT-4 Turbo能测出来。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

这条推特被公开承认自己参与过Q*的Lukasz Kaiser转发。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

Noam Brown也发推表示新版GPT-4 Turbo在推理能力上大幅提升——要知道，这位OpenAI科学家一直被外界认为正在研究Q*。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

各方信息汇总后，网友们一拍脑袋反应过来，这其中会不会就引入了Q*啊？

数学方面的提升意味着其中可能包含了一个数学模型，可能是Q*。

（以及他的数学题测试推特被OpenAI的人转发了）

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

好家伙，难道OpenAI在悄悄搞大事？

新GPT-4的“新马脚”？

OpenAI官方公告表示，最新版本的GPT-4 Turbo全方位大提升，现在ChatGPT用户可直接体验。

网友立马冲去实测，有人给出评估结果，特别是数学/推理能力有了重大提升。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

实际问题测试中，在多个数学推理题上，GPT-4 Turbo都没有翻车，但是如Command-R plus、Clauede-3 Opus等都有失误。

比如一道乘电梯的推理题。陷阱在于这部神奇电梯无论坐几层，最后都会停在一层。GPT-4 Turbo理解了这层逻辑，最后给出了正确答案。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

还有在修改二叉树问题上，GPT-4 Turbo不仅回答正确，而且过程清晰完整。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

同时在“大海捞针”能力上，与之前版本对比，最新GPT-4 Turbo已经是出版GPT-4能力的4.3倍。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

竞技场的结果表明，在代码能力方面，GPT-4 Turbo也更强了。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

文本输出方面变得更加简洁。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

生成代码也少了很多废话（下图右侧为新版本）。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

有人补充说，生成速度上也更快了。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

神秘Q*：OpenAI的最大秘密？

现在Q*已经成了OpenAI的流量密码了，只要出现这个关键字，网友们都会兴奋不已。

毕竟当初奥特曼宫斗大戏就和它有关联，还有人发出警告，Q*预示着AGI即将出现。

不过官方一直没有公开承认过这个项目的存在，奥特曼拒绝回答，Transformer作者公开承认参与Q*也被OpenAI公关跳起来捂嘴。

从目前各方透露的信息来看，Q*专注于逻辑和数学推理能力，数学能力突出。

Transformer作者之一Lukasz Kaiser承认自己参与了这个项目。

德扑AI之父、前FAIR（Meta）研究科学家Noam Brown也被视为是Q*项目的重要成员（推测来自LeCun）。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

他加入OpenAI的动作也被外界视为分析Q*的一个线索，“有理由怀疑Q是将LLM和AlphaGo结合起来，并用强化学习进行训练”。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

Noam Brown开发出了第一个在打扑克牌上超越人类的AI，后来加入Meta致力于让AI学会玩Diplomacy（外交游戏）。

目前，关于Q*的准确信息还是非常少。

可能奥特曼还在等一个合适的时机来回应外界。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

One More Thing

btw，网友们意外捉到总裁Brockman转发的一个视频演示里的提示词是：

创建一个python脚本，使用pytube库从YouTube下载视频。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

看来大家拿GPT-4干的事也都差不多嘛（doge）。

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

参考链接：
[1]https://twitter.com/lukaszkaiser
[2]https://twitter.com/skirano/status/1778122305471705489
[3]https://twitter.com/7oponaut/status/1777971159478194256
[4]https://twitter.com/ai_for_success/status/1778073765748064678
[5]https://www.understandingai.org/p/how-to-think-about-the-openai-q-rumors

版权所有，未经授权不得以任何形式转载及使用，违者必究。

GPT-4 OpenAI Q*

相关阅读

GPT-4满分第一名通过大厂模拟面试！微软154页研究刷屏：与AGI的第一次接触

梦晨2023-03-25

GPT-4 OpenAI

ChatGPT一枪打服谷歌AI人才！情人节组团加盟OpenAI

网友：史上最强招聘广告

十三2023-02-15

ChatGPT OpenAI 谷歌

GPT-4私教辅导6周=在校上课2年，新研究：AI辅助越多进步越明显

OpenAI总裁忍不住点赞

西风2025-01-16

AI辅助学习 GPT-4

国产大模型推理能力已超GPT-3.5！冲进OpenAI评测榜第一梯队

已公开评测数据，速来申请API

衡宇2023-09-18

OpenAI 大语言模型推理能力

百川智能上新超千亿大模型Baichuan 3，冲榜成绩：若干中文任务超车GPT-4

重点打磨逻辑推理和强化学习

衡宇2024-01-29

GPT-4 大模型百川智能

200字带你看完一本书，GPT-3已经会给长篇小说写摘要了

给12万字《傲慢与偏见》原文写出175字摘要。

博雯2021-09-26

GPT-3 OpenAI 书摘

热门文章

DeepSeek引爆「万物皆可AI」时代，20余位大咖分析行业痛点，万字梳理干货在此

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

发放1亿元代金券！商汤大装置SenseCore 2.0全新升级

3分钟搭建一个调用支付宝的智能体，MCP爆发，蚂蚁推了一把

中国AI投资五小龙：南林北曹，东剑西米，中王淮；清一色985理工科背景