Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

西风 2024-03-09 10:49:02 来源：量子位

GPT-5或许能实现屏幕共享？

西风发自凹非寺

量子位 | 公众号 QbitAI

谷歌Gemini修改bug让网友大开眼界！

X一小伙分享，为测试Gemini 1.5 Pro，自己在编写一个网页的代码时故意留了3个bug，并分别录制了网页bug视频。

接着把代码库打包成文件连同视频一起输给了Gemini 1.5 Pro，提示它找到并修复代码中的所有bug，且要提供一个简要指南以及所做更改的说明。

没想到，Gemini 1.5 Pro还真就分分钟正确识别并修复了每一个bug。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

小伙将这种玩法po出来后热度不断攀升，网友们纷纷一键三连，转赞收藏量过万。

其本人还在评论区强调，“这只是一个简单的例子，也将是它最差的表现”，Gemini这小汁前途不可限量啊。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

有网友表示想起来一件事觉得有趣：英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”，那时候还有很多人反对称“AI不会取代程序员”。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

但甭管怎么说，AI可以给程序员提供帮助是有目共睹的。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

接下来我们展开来看Gemini 1.5 Pro修复bug的经过。

事件经过

正如开头提到的，网友先是在编写网页代码时故意写错了3处：

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

这就导致网页上的一些功能操作无法正常运行，于是小伙分别拍摄了3处无法正常运行的视频，每个视频十几秒。

然后将视频连同代码库一起输给了Gemini 1.5 Pro。

prompt为：

Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug，为我创建一个简单的Markdown指南以修复bug，然后编写实际的代码来修复。我需要完整的代码，就像它是为了一个完整的Pull Request一样，这样我才能进行更改。)

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

随后，Gemini 1.5 Pro立刻准确识别了3个bug：

点击一个待办事项并不会将其标记为完成/未完成
主题切换器不会切换主题
点击登录按钮不会触发任何操作

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

紧接着就分别给出了修复方案，附带代码：

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

小伙仔细对照自己敲的代码，确认Gemini 1.5 Pro给出的答案是正确的：

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

小伙还强调，这3个bug在代码库文件中其实离着很远，这也就意味着Gemini 1.5 Pro确实读完了完整的上下文。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

“想要访问权限”

网友看到这一系列操作后激动搓手，直呼想要Gemini 1.5 Pro访问权限：

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

除坐等外，还有网友表示用GPT-4帮忙修复代码也很好使，顺带畅想了一下GPT-5：

接下来可能是实时交互？或许能与GPT-5进行屏幕共享？

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

而另一边已经获得访问权限的网友早就玩嗨了。

比如，一次性输给Gemini 1.5 Pro最新的10篇论文，让它从中找到一个作者的电子邮件地址。

结果Gemini 1.5 Pro第一次就成功找到了：

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

然后又让Gemini 1.5 Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人，Gemini 1.5 Pro也成功找到了。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

测试继续上难度，一次性输入三本书，Gemini 1.5 Pro最后用时约1分钟再次成功找到对应的说话人：

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

惊讶之余，这位测试者总结了Gemini 1.5 Pro的逻辑推理能力：

对于常规提示，接近GPT-4的性能。

但当我添加数十个例子时，Gemini的性能在提升，似乎没有上限。多示例提示成为了新的微调方法。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

沃顿商学院教授Ethan Mollick也来整活了。输给Gemini 1.5 Pro一本352页的《太空60年》规则手册，约250000token，然后要求它扮演一个角色。

即使说明书分散在很多页上，而且非常复杂，但Gemini“似乎明白了”：

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

Ethan Mollick教授表示，对所有其他AI进行这项测试都是失败的，只有Gemini 1.5 Pro成功了。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

这位网友想要编译整个X算法的代码存储库并将其上传到Gemini 1.5 Pro，正在线向网友征集想问的问题。

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

只见编译完成后，共310489token，Dogan Ural向Gemini 1.5 Pro提出了网友们关心的一系列问题，比如“在推特上扩大或者减少影响力的前5件事是什么？”

Gemini 1.5 Pro很轻松地给出了这样婶儿的答案：

Gemini修bug神了！录网页视频把代码库甩给它就行，网友坐不住了：想要访问权限

你还见过哪些有趣的玩法？欢迎评论区分享～

参考链接：

[1]https://twitter.com/mckaywrigley/status/1762175776726663267
[2]https://twitter.com/mattshumer_/status/1759981272779108403?s=46&t=iTysI4vQLQqCNJjSmBODPw

— 完 —

版权所有，未经授权不得以任何形式转载及使用，违者必究。

相关阅读

谷歌Gemini扳回一局！多模态能力和GPT-4V不分伯仲｜港中文128页全面测评报告

不过两者都算“半斤八两”

丰色2023-12-22

Gemini 多模态

力压DeepSeek-R1！谷歌Gemini 2.0系列集体上新，全员跻身大模型竞技场前10

Jeff Dean大秀其编程能力

衡宇2025-02-06

DeepMind Gemini 谷歌

谷歌最强开源大模型亮相！Gemini技术下放，笔记本就能跑，可商用

性能全面超越开源标杆Llama 2

明敏2024-02-22

Gemini Gemma 开源谷歌

刚刚，谷歌发布超大杯Gemini，全面对标GPT-4，前2个月免费！

一手实测zai

十三2024-02-09

Gemini Gemini Advanced 谷歌

Transformer“贡献最大”作者，重返谷歌出任Gemini联合技术主管

与Jeff Dean一起共事

十三2024-08-23

Gemini Transformer 谷歌

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外思考时间

白交2024-09-26

Gemini 谷歌

热门文章

鹅厂开源视频生成大杀器！参考图主体精准复刻，还能编辑现有视频

Qwen上新AI前端工程师！一句话搞定HTML/CSS/JS，新手秒变React大神

大模型重塑服务生态，容联七陌「AI进化论」探索智能客服新未来

开源即屠榜！UniME多模态框架登顶MMEB训练榜，刷新多项SOTA纪录

夸克即将发布“深度搜索Pro”，能力比肩DeepResearch