随着 Anthropic 正式发布 Opus 4.6 模型,一场关于 AI 自主编程能力的硬核实验引发了科技圈的热议。Anthropic 安全团队研究员 Nicholas Carlini 近日透露,他利用 16 个 Claude 智能体(Agents)组建了一个“特工团队”,在几乎没有人工干预的情况下,从零开始编写出了一个基于 Rust 语言的 C 编译器。
这场实验堪称“昂贵”。在为期两周的开发周期内,这些 AI 智能体经历了近 2000 次代码会话,消耗了约 20 亿个输入 Token,最终产生的 API 费用高达 2 万美元(约合 14.4 万人民币)。然而,投入换来了惊人的产出:这支 AI 团队自主生成了超过 10 万行代码,且该编译器成功实现了在 x86、ARM 和 RISC-V 架构上编译 Linux 6.9 内核。
尽管成果斐然,Carlini 却表达了“兴奋与不安并存”的复杂心情。他发现,虽然 AI 可以通过循环指令实现 24 小时无间断工作,自主解决“下一个最显而易见”的问题,但其生成的代码质量仍不及顶尖人类程序员,且在缺乏引导时容易陷入无效测试的死循环。更有观察者在 GitHub 上调侃,这种从海量训练数据中“拼凑”出的代码并非真正意义上的从零创作。这场实验不仅展示了智能体团队协作处理复杂项目的潜力,也让开发者们开始审视软件自动化生产背后的安全与验证风险。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则