Facebook评论软件,Twitter群控软件,电报获客软件,Twitter出海营销软件下载软件请访问www.vst.tw转载自《AGI Hunt》AI 工具让资深开发者效率降低了19%,而不是提升。刚刚,METR发布了一份关于AI 编程的研究报告,像一记重拳打在了整个AI编程工具行业的脸上。这不是什么小打小闹的实验室测试,而是16位资深开源开发者在他们自己维护的项目上进行的246个真实任务测试。这些项目平均拥有22,000+星标和超过100万行代码。最讽刺的是什么?开发者们在测试前预期AI能让他们快24%,测试后仍然觉得自己快了20%。但秒表不会说谎:他们实际上慢了19%。上图完美展示了「期望」与「现实」的残酷对比。左边是各方的预测:经济学专家认为AI能提速40%,机器学习专家猜35%,开发者自己估计25-30%。右边那个刺眼的红点,是实测结果:慢了约20%。测试是怎么进行的METR的实验设计可算是十分严谨。他们找来的不是新手,而是在各自项目上平均贡献了5年时间和1500次提交的核心维护者。每个开发者提供他们日常工作中的真实任务:bug修复、新功能开发、代码重构。这些任务被随机分配到「允许使用AI」或「禁止使用AI」两组。允许使用AI时,开发者主要选择Cursor Pro配合Claude 3.5/3.7 Sonnet(当时的前沿模型)。平均每个任务耗时2小时,开发者需要录屏并报告完成时间。为了确保参与积极性,每小时报酬高达150美元。AI 到底慢在哪里研究团队深入分析了开发者的工作模式,发现了一个有趣的现象:使用AI时,开发者编码和搜索信息的时间确实减少了。但这些节省的时间都去哪了?研究显示:编写提示词:反复调整prompt,试图让AI理解需求等待AI响应:生成代码需要时间审查AI输出:仔细检查生成的代码空闲时间:可能是在思考如何更好地使用AI更要命的是,只有44%的AI生成代码被保留,其余的要么被完全丢弃,要么需要大幅重写。展开全文