Anthropic呼吁全球顶级AI实验室考虑协调放缓,警告AI系统可能很快获得在无需人类监督的情况下自行改进的能力——该公司表示这一临界点可能在两年内到来。
Anthropic呼吁全球顶级AI实验室考虑协调放缓,警告AI系统可能很快获得在无需人类监督的情况下自行改进的能力——该公司表示这一临界点可能在两年内到来。

Anthropic,这家估值达9650亿美元、旗下拥有Claude聊天机器人的AI初创公司,周四发布了一篇博文,敦促全球领先的人工智能实验室考虑协调暂停前沿模型的开发。该公司警告称,AI系统正逼近"递归自我改进"——即在无需人类干预的情况下设计和构建自身后继者的能力——并表示这一临界点可能在两年内或更短时间内到来。
"如果能够有效减缓这项技术的发展,给自己更多时间来应对其巨大影响,我们认为这很可能是一件好事,"Anthropic内部研究部门负责人Marina Favaro与公司政策负责人Jack Clark在题为《当AI自我构建时》的博文中写道。
这一警告伴随着Anthropic此前从未公开披露的内部数据。截至2026年5月,Anthropic生产代码库中合并的代码有超过80%由该公司的AI模型Claude编写。普通工程师现在每天合并的代码量是2024年的八倍。在3月份对130名研究人员进行的一项调查中,员工中位数估计,使用公司最新模型Mythos Preview后,其工作效率大约是未使用任何AI工具时的四倍。
暂停的呼吁对Anthropic而言恰逢一个尴尬时刻。该公司最近完成了650亿美元的H轮融资,使其估值达到约9650亿美元,超越OpenAI成为全球估值最高的AI初创公司。它还秘密提交了首次公开募股的文件。据该公司称,年化收入已从2025年底的900亿美元飙升至2026年6月的约5000亿美元。
递归自我改进的临界点
Anthropic的核心担忧是一个被称为递归自我改进的概念——即AI系统能够在无需人类指导的情况下自主设计、编程和训练其继任模型。该公司描绘了一条演进路径:早期的Claude模型(2021-2023年)需要人类编写所有代码;到2023-2025年,聊天机器人辅助编写代码片段;到2025-2026年,编码智能体独立编写和修改整个文件;而如今,自主智能体可以运行代码并将任务委派给其他智能体。最终阶段——即Claude构建并改进未来版本的"闭环"——尚未到来,但Clark写道,他相信"可能在两年内或更短时间内发生"。
数据也印证了能力的加速提升。Claude能够独立完成的任务持续时间每四个月翻一番,而此前这一周期为七个月。2024年3月的Claude Opus 3可以处理约需四分钟人工完成的任务;一年后的Claude Opus 4.6则能处理12小时的任务。据研究机构METR称,Anthropic最新模型Mythos Preview可以持续工作至少16小时,该模型"处于METR在不引入新任务的情况下所能测量的上限"。
在SWE-bench(一项标准的现实世界软件工程基准测试)上,模型得分在两年内从个位数上升至接近饱和。在CORE-Bench(测试模型能否复现已发表研究成果)上,成功率从2024年的约20%攀升至15个月内饱和基准测试。
批评者认为这是一场监管俘获游戏
Anthropic的安全优先姿态引发了竞争对手和行业观察人士的质疑。OpenAI首席执行官Sam Altman指责该公司进行"恐惧营销",他上个月表示:"说'我们造了一颗炸弹,马上就要扔到你头上。我们将以1亿美元卖给你一个防弹避难所',这显然是非常出色的营销。"
风险投资家、美国总统唐纳德·特朗普的非正式顾问David Sacks指责Anthropic推行"监管俘获议程"——利用关于存在风险的警告来推动严苛的监管,从而限制低成本开源模型并增加对Anthropic专有技术的需求。
宾夕法尼亚大学沃顿商学院教授Ethan Mollick在X平台上发文称,这篇博文包含"一些自省、一些营销,以及大量关于Anthropic认为AI近期可能走向何方的非常真诚的信念。"
Anthropic承认任何全球暂停都面临验证难题。"训练运行比导弹发射井更容易隐藏,"作者写道,并将这一努力与冷战时期的军备控制条约相提并论。"有意义的放缓或暂停需要多个位于或接近前沿的、资源充足的实验室,在多个国家,同意在相同条件下停止。"
该公司表示,其Anthropic研究所将与合作伙伴合作,研究可信的验证系统应如何构建,并计划组织与政策制定者和研究人员进行更广泛的辩论。如果这样的系统能够建立,Anthropic表示愿意放缓或暂停自身的开发——前提是其他前沿实验室能够以可验证的方式同样做到。
对投资者的意义
Anthropic呼吁协调暂停,这在整个AI行业资本大量涌入的当下引入了监管不确定性。该公司自身的数据——显示工程师产出提升8倍、生产力提升4倍——同时也强化了AI能带来可衡量经济回报的投资逻辑。矛盾之处在于,Anthropic既是AI加速发展的受益者,也是呼吁其停止的最响亮的声音。
OpenAI也预计将很快寻求IPO,两家公司合计代表约2万亿美元的合并市场价值。从这场辩论中产生的任何监管框架,都可能决定哪种商业模式——专有 vs. 开源、安全优先 vs. 速度优先——最终胜出。就目前而言,市场尚未将全球协调暂停的风险计入价格,部分原因是执行机制仍不明确,而作弊的动机则极为巨大。
本文仅供参考,不构成投资建议。