Anthropic敦促全球暂停AI开发警告模型将很快具备自我改进能力

Anthropic，这家估值达9650亿美元、旗下拥有Claude聊天机器人的AI初创公司，周四发布了一篇博文，敦促全球领先的人工智能实验室考虑协调暂停前沿模型的开发。该公司警告称，AI系统正逼近"递归自我改进"——即在无需人类干预的情况下设计和构建自身后继者的能力——并表示这一临界点可能在两年内或更短时间内到来。

"如果能够有效减缓这项技术的发展，给自己更多时间来应对其巨大影响，我们认为这很可能是一件好事，"Anthropic内部研究部门负责人Marina Favaro与公司政策负责人Jack Clark在题为《当AI自我构建时》的博文中写道。

这一警告伴随着Anthropic此前从未公开披露的内部数据。截至2026年5月，Anthropic生产代码库中合并的代码有超过80%由该公司的AI模型Claude编写。普通工程师现在每天合并的代码量是2024年的八倍。在3月份对130名研究人员进行的一项调查中，员工中位数估计，使用公司最新模型Mythos Preview后，其工作效率大约是未使用任何AI工具时的四倍。

暂停的呼吁对Anthropic而言恰逢一个尴尬时刻。该公司最近完成了650亿美元的H轮融资，使其估值达到约9650亿美元，超越OpenAI成为全球估值最高的AI初创公司。它还秘密提交了首次公开募股的文件。据该公司称，年化收入已从2025年底的900亿美元飙升至2026年6月的约5000亿美元。

递归自我改进的临界点

Anthropic的核心担忧是一个被称为递归自我改进的概念——即AI系统能够在无需人类指导的情况下自主设计、编程和训练其继任模型。该公司描绘了一条演进路径：早期的Claude模型（2021-2023年）需要人类编写所有代码；到2023-2025年，聊天机器人辅助编写代码片段；到2025-2026年，编码智能体独立编写和修改整个文件；而如今，自主智能体可以运行代码并将任务委派给其他智能体。最终阶段——即Claude构建并改进未来版本的"闭环"——尚未到来，但Clark写道，他相信"可能在两年内或更短时间内发生"。

数据也印证了能力的加速提升。Claude能够独立完成的任务持续时间每四个月翻一番，而此前这一周期为七个月。2024年3月的Claude Opus 3可以处理约需四分钟人工完成的任务；一年后的Claude Opus 4.6则能处理12小时的任务。据研究机构METR称，Anthropic最新模型Mythos Preview可以持续工作至少16小时，该模型"处于METR在不引入新任务的情况下所能测量的上限"。

在SWE-bench（一项标准的现实世界软件工程基准测试）上，模型得分在两年内从个位数上升至接近饱和。在CORE-Bench（测试模型能否复现已发表研究成果）上，成功率从2024年的约20%攀升至15个月内饱和基准测试。

批评者认为这是一场监管俘获游戏

Anthropic的安全优先姿态引发了竞争对手和行业观察人士的质疑。OpenAI首席执行官Sam Altman指责该公司进行"恐惧营销"，他上个月表示："说'我们造了一颗炸弹，马上就要扔到你头上。我们将以1亿美元卖给你一个防弹避难所'，这显然是非常出色的营销。"

风险投资家、美国总统唐纳德·特朗普的非正式顾问David Sacks指责Anthropic推行"监管俘获议程"——利用关于存在风险的警告来推动严苛的监管，从而限制低成本开源模型并增加对Anthropic专有技术的需求。

宾夕法尼亚大学沃顿商学院教授Ethan Mollick在X平台上发文称，这篇博文包含"一些自省、一些营销，以及大量关于Anthropic认为AI近期可能走向何方的非常真诚的信念。"

Anthropic承认任何全球暂停都面临验证难题。"训练运行比导弹发射井更容易隐藏，"作者写道，并将这一努力与冷战时期的军备控制条约相提并论。"有意义的放缓或暂停需要多个位于或接近前沿的、资源充足的实验室，在多个国家，同意在相同条件下停止。"

该公司表示，其Anthropic研究所将与合作伙伴合作，研究可信的验证系统应如何构建，并计划组织与政策制定者和研究人员进行更广泛的辩论。如果这样的系统能够建立，Anthropic表示愿意放缓或暂停自身的开发——前提是其他前沿实验室能够以可验证的方式同样做到。

对投资者的意义

Anthropic呼吁协调暂停，这在整个AI行业资本大量涌入的当下引入了监管不确定性。该公司自身的数据——显示工程师产出提升8倍、生产力提升4倍——同时也强化了AI能带来可衡量经济回报的投资逻辑。矛盾之处在于，Anthropic既是AI加速发展的受益者，也是呼吁其停止的最响亮的声音。

OpenAI也预计将很快寻求IPO，两家公司合计代表约2万亿美元的合并市场价值。从这场辩论中产生的任何监管框架，都可能决定哪种商业模式——专有 vs. 开源、安全优先 vs. 速度优先——最终胜出。就目前而言，市场尚未将全球协调暂停的风险计入价格，部分原因是执行机制仍不明确，而作弊的动机则极为巨大。

本文仅供参考，不构成投资建议。