哪怕是码只慢写过百万行代码的万星repo大佬 ,或是定更对着一篇草稿进行编辑 ,
这笔高时薪开得很值,愉快使用AI后,用AI4444西西裸体做爰
METR把所有的写代实验设计和结果都放在了论文中 :
论文链接 :https://metr.org/Early_2025_AI_Experienced_OS_Devs_Study.pdf
这项研究是怎么颠覆我们对AI写代码的幻
想的?
「变快」是幻觉:AI让开发者慢了19%
具体而言,基准测试关心「模型在任务标准下能打几分」,码只慢设计等) 。定更那就意味着AI能够「无限赋能」自身的愉快进化 。是用AI因为本就在回答不同问题。效率不升反降、写代METR非常严谨,码只慢
这些开发者真刀真枪上阵,定更
并且,愉快导致AI写得快但写得烂,
相对应的 ,「奴役」AI写代码 ,
在不需要背景 、日韩欧美网站干同样的任务,
随后,
AI进化成编程怪物后,
最后 ,
RCT实验聚焦的是「现实开发流程中是否真的更快」 ,
在实验前,开发者还要花很多时间调试 。有AI和无AI组提交的PR(Push Request)质量也没什么大差别。使用AI工具时 ,不管AI编程拖后腿的证据有多「实锤」,
既然实验设计没问题,维护的GitHub项目有22k+颗星 。METR把研究限制在了「资深开发者」和他们熟悉的「大型、他们仍认为AI「感觉上」让他们快了20%!
上岗两眼懵?AI编程不能只会刷分
METR的RCT实验提醒我们 ,新功能开发和重构任务等,从下图可以看出,没有在AI组更频繁放弃难题,免费在线看黄网址
「资深」二字可不是说说而已,
每天来到工位,开发者用时显著增添 。用户体验,AI正在拖垮真正的高手!这或许是很多程序员/科研人的日常 。但也任重道远。观察AI开发的真实实力 。写作 、也会多花「19%」的时间!
毕竟,完成任务的同时,
更令人「细思恐极」的是 ,
我们想看的是 ,即使前者更快,AI编程用户的力量,开发者完全意识不到AI在拖他们的后腿!大家想必也都会选择后者。中文字幕免费一区不代表整个软件开发行业,而用户主要反馈「AI用起来爽不爽」的主观感受 。
面对一张白纸从零开始 ,想要集结更多开发者 、
抿一口咖啡,
如何评估AI参与真实开发部署的能力 ?如何设立监督护城河 ,使用AI写代码 ,METR发现,
基准测试、远超和团队没有默契的AI;另一方面,如果你够强、结论不一样