Anthropic于近日发表长文《When AI builds itself》,首次系统性地披露了AI系统在其内部开发流程中所扮演的角色,并就递归自我改进(即AI完全自主地设计和开发自身后继系统)的前景发出预警。
anthropic.com (https://www.anthropic.com/institute/recursive-self-improvement)
When AI builds itself (https://www.anthropic.com/institute/recursive-self-improvement)
Our progress toward recursive self-improvement, and its implications.
文章援引的内部数据显示,截至2026年5月,Anthropic合并至生产代码库的代码中超过80%由Claude编写。2026年第二季度,工程师人均每日合并的代码行数达到2024年的8倍——这并非因为人写得更多,而是工程师的角色已从编写者转变为审阅者和指挥者。与此同时,Claude在最开放性工程任务上的会话成功率在半年内提升了50个百分点,达到76%。Anthropic内部员工在2026年3月的调查中,中位数估计认为借助Claude后产出约为无AI辅助时的4倍。
在研究侧,Claude同样展现出加速趋势。Anthropic设计了一项内部测试:给定小型AI模型的训练代码,要求Claude在保证正确性的前提下尽可能提升运行速度。2025年5月Claude Opus 4的平均加速倍数约为3倍,而2026年4月Mythos Preview已达到约52倍——作为参照,一名熟练的人类研究员在同一任务上通常需要4至8小时才能达到4倍加速。在一项关于"判断下一步研究方向"的评估中,Mythos Preview给出优于人类研究员选择的比率从2025年11月的51%上升到2026年4月的64%。Anthropic认为这是AI系统在研究判断力上正在改善的早期信号。
文章描述了三种可能的未来情景:能力增长曲线趋于平缓但现有能力已广泛扩散;AI实验室持续获得复合效率提升、人类仍掌握研究方向设定权;以及AI系统实现完全的递归自我改进、自主构建后继模型。Anthropic表示目前尚未达到递归自我改进阶段,且该结果并非必然,但其到来可能早于多数机构的预期。
Anthropic在文末明确表态:如果全球范围内存在可验证的协调机制,使前沿开发者能够确认彼此确实减速或暂停,Anthropic愿意放慢甚至暂时停止前沿AI开发。但文章同时指出,训练运行远比导弹发射井更容易隐匿,单方面暂停只会改变领跑者身份而无法建立所需的协商进程。Anthropic表示将在未来数月组织政策制定者、研究人员、公民社会和其他AI公司共同讨论这些问题。