重点提要:
- 根据评估机构 METR 的数据,Anthropic 的 Claude Mythos AI 模型在人类通常需要 16 小时完成的软件任务中实现了 50% 的成功率。
- Palo Alto Networks 报告称,使用此类前沿 AI 模型可将一年的漏洞分析工作压缩至仅三周,并在几分钟内创建攻击链。
- 批评人士指出,50% 的成功率尚不足以进行完全自主部署,凸显了研究基准与企业级可靠性之间的差距。
重点提要:

一项新的 AI 基准表明,模型现在可以处理耗时 16 小时的任务,跨越了自主工作和网络安全应用的关键门槛。
来自 Anthropic 的前沿 AI 模型已证明能够自主完成长达 16 小时的复杂软件工程任务,这一新的能力阈值正在重塑 AI 驱动的网络安全格局。AI 评估小组 METR 的结果表明模型能力呈现超指数级增长,Palo Alto Networks Inc. 等网络安全供应商报告称,这一趋势已对进攻和防御行动产生了巨大影响。
Palo Alto Networks 在一份关于该技术影响的近期报告中写道:“利用 [前沿 AI] 辅助漏洞分析,在短短 3 周内完成工作的深度和广度,相当于一整个顶尖渗透测试团队一整年的工作量。”
新基准显示,Anthropic 的 Claude Mythos 模型在需要人类工作 16 小时的任务中可以达到 50% 的成功率。这种能力的飞跃正迫使软件界迅速重新评估风险和生产力。获得该模型早期访问权限的 Palo Alto Networks 发现,它可以将寻找并串联多个低风险漏洞以形成致命攻击链的过程压缩至仅 25 分钟。
这一发展加速了网络安全公司之间的 AI 军备竞赛,给 Palo Alto Networks (PANW)、Fortinet (FTNT) 和 Zscaler Inc. 等现有巨头带来了压力。它还加剧了 Anthropic 与其对手 OpenAI 等 AI 开发商之间的平台竞争。对于投资者而言,关键问题在于这种新水平的 AI 自主性如何转化为可靠的企业产品和可持续的收入流。
METR 的“时间跨度”图表衡量了前沿模型可以完成的软件开发任务的长度。最新结果显示,Mythos 在一半的时间内成功处理了 16 小时的任务,这比模型前几年能处理的分钟级或单小时任务有了显著飞跃。评估机构指出,其自身测试模型的能力正面临挑战,因为旨在耗时 16 小时以上的任务数量有限,因此很难衡量模型能力的真正上限。
这种快速且加速的进展被称为“超指数级”增长,AI 能力的每一次代际飞跃似乎都比上一次更大。趋势线表明,原预测 2027 年才能达到的能力现已实现,这既引发了对生产力提升的兴奋,也引发了对日益强大和自主的 AI 代理安全隐患的担忧。
Palo Alto Networks 的研究发现为 METR 基准的含义提供了一个鲜明的现实案例。将人类顶尖团队一年的工作量自动化为三周,代表了网络进攻与防御平衡的根本性转变。
这种能力并不局限于一家公司。竞争对手也在整合先进 AI。最近被评为 2026 年 Gartner 全球威胁情报领导者的 CrowdStrike Holdings (CRWD) 正在扩大其 Project QuiltWorks 联盟,将前沿 AI 应用于风险管理。SentinelOne (S) 推出了 Wayfinder 服务,利用 AI 识别并确定可利用攻击路径的优先级,而 Okta Inc. (OKTA) 正在开发新框架,以管理 AI 代理本身的身份。
虽然 16 小时的数字令人印象深刻,但批评者警告不要过度推断该基准。关键的限制因素是 50% 的成功率。对于研发工作,人类专家可以审查并丢弃失败的尝试,那么在 16 小时任务上达到 50% 的成功率是具有变革性的,它有效地使人类工程师的产出翻了一番。
然而,对于部署在生产环境中的完全自主系统,50% 的失败率是不可接受的。AI 研究员 Gary Marcus 在最近的一份分析中指出:“自主商业使用的可靠性阈值在 95% 到 99.9% 之间。”他认为,METR 图表仅关注 50% 的成功线,并未显示 AI 缩小与企业级可靠性差距的速度有多快。关于从 50% 到 99% 成功率需要多久的争论,是围绕通用人工智能 (AGI) 及其现实影响讨论的核心。
本文仅供参考,不构成投资建议。