关闭广告

Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了

量子位3606人阅读

西风 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌Gemini修改bug让网友大开眼界!

X一小伙分享,为测试Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了3个bug,并分别录制了网页bug视频。

接着把代码库打包成文件连同视频一起输给了Gemini 1.5 Pro,提示它找到并修复代码中的所有bug,且要提供一个简要指南以及所做更改的说明。

没想到,Gemini 1.5 Pro还真就分分钟正确识别并修复了每一个bug。



小伙将这种玩法po出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。

其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini这小汁前途不可限量啊。



有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI不会取代程序员”





但甭管怎么说,AI可以给程序员提供帮助是有目共睹的。



接下来我们展开来看Gemini 1.5 Pro修复bug的经过。

事件经过

正如开头提到的,网友先是在编写网页代码时故意写错了3处:



这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了3处无法正常运行的视频,每个视频十几秒。

然后将视频连同代码库一起输给了Gemini 1.5 Pro。

prompt为:

Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug,为我创建一个简单的Markdown指南以修复bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的Pull Request一样,这样我才能进行更改。)



随后,Gemini 1.5 Pro立刻准确识别了3个bug:

  • 点击一个待办事项并不会将其标记为完成/未完成
  • 主题切换器不会切换主题
  • 点击登录按钮不会触发任何操作



紧接着就分别给出了修复方案,附带代码:



小伙仔细对照自己敲的代码,确认Gemini 1.5 Pro给出的答案是正确的:



小伙还强调,这3个bug在代码库文件中其实离着很远,这也就意味着Gemini 1.5 Pro确实读完了完整的上下文。



“想要访问权限”

网友看到这一系列操作后激动搓手,直呼想要Gemini 1.5 Pro访问权限:





除坐等外,还有网友表示用GPT-4帮忙修复代码也很好使,顺带畅想了一下GPT-5:

接下来可能是实时交互?或许能与GPT-5进行屏幕共享?



而另一边已经获得访问权限的网友早就玩嗨了。

比如,一次性输给Gemini 1.5 Pro最新的10篇论文,让它从中找到一个作者的电子邮件地址。

结果Gemini 1.5 Pro第一次就成功找到了:



然后又让Gemini 1.5 Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人,Gemini 1.5 Pro也成功找到了。





测试继续上难度,一次性输入三本书,Gemini 1.5 Pro最后用时约1分钟再次成功找到对应的说话人:



惊讶之余,这位测试者总结了Gemini 1.5 Pro的逻辑推理能力:

对于常规提示,接近GPT-4的性能。
但当我添加数十个例子时,Gemini的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。



沃顿商学院教授Ethan Mollick也来整活了。输给Gemini 1.5 Pro一本352页的《太空60年》规则手册,约250000token,然后要求它扮演一个角色。

即使说明书分散在很多页上,而且非常复杂,但Gemini“似乎明白了”:



Ethan Mollick教授表示,对所有其他AI进行这项测试都是失败的,只有Gemini 1.5 Pro成功了。



这位网友想要编译整个X算法的代码存储库并将其上传到Gemini 1.5 Pro,正在线向网友征集想问的问题。



只见编译完成后,共310489token,Dogan Ural向Gemini 1.5Pro提出了网友们关心的一系列问题,比如“在推特上扩大或者减少影响力的前5件事是什么?”

Gemini 1.5Pro很轻松地给出了这样婶儿的答案:



你还见过哪些有趣的玩法?欢迎评论区分享~

[1]https://twitter.com/mckaywrigley/status/1762175776726663267
[2]https://twitter.com/mattshumer_/status/1759981272779108403?s=46&t=iTysI4vQLQqCNJjSmBODPw

— 完 —

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

5个关键词,读懂2024年国家账本

经济观察报 浏览 3507

女子买二手房"滴滴滴"声每半分钟响一次 无法确定来源

潇湘晨报 浏览 20705

美媒称巴勒斯坦民众举白旗撤离遭以军射击

环球网资讯 浏览 3972

鹏华基金,也亏麻了

包不同 浏览 4076

海天味业的艰难时刻!还记得“酱油茅”立下的目标吗?

天下财道社 浏览 3994

美5名海军陆战队员在坠机事故中死亡

央视新闻客户端 浏览 3985

5家公司回购超十亿! 个股腰斩后控股股东抛出大幅增持计划!

私募排排网 浏览 2347

道指再创收盘新高,台积电业绩大超预期,市值突破1万亿美元

第一财经资讯 浏览 884

许娣的臃肿,陈小艺的窒息,老戏骨演起戏来,真没主角什么事了

不八卦会死星人 浏览 4109

这会儿想起我来了?穆迪三分8中4 贡献全队最高21分&没有失误

直播吧 浏览 4351

以部长喊话布林肯:现在对哈马斯要用“大棒”

环球网资讯 浏览 4235

美官员称台湾地区选举结束后美将派团访台 外交部回应

财联社 浏览 28171

好家伙!《武林外传》姐妹篇开播差评一片,观众差评理由出奇一致

娱乐圈笔娱君 浏览 4126

高股息三问:当前拥挤了吗?赚的什么钱?能否持续?

网易财经 浏览 4201

蒋勤勤获亚洲电影大奖最佳女主角

电和影 浏览 3375

TVB明星待遇:梁朝伟化妆要排队,视帝不能迟到,对比内娱太讽刺

文艺圈娱乐号 浏览 4487

Skip:在全明星赛之后 我们要看看利拉德在六月能否更出色

直播吧 浏览 3984

版权问题日渐被重视!OpenAI据称正与多家媒体谈判

财联社 浏览 4137

资金涌入债券基金 后市债市波动可能加大

经济观察报 浏览 3640

这几件配饰太火了,今年流行的风格都离不开它

LinkFashion 浏览 2014

科学家证实,中国“天眼”锁定F22绝非意外

浏览 1957
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备2023013132号-1