主要发现
人工智能公司Anthropic的一个配置错误导致近3,000份内部文件泄露,从而揭示了一个名为“Claude Mythos”的强大新模型。尽管该模型代表了能力的“代际飞跃”,但该公司以其可能引发前所未有的网络攻击为由,暂不向公众发布。
- 内容管理系统(CMS)中的一个配置错误无意中使Anthropic近3,000份内部文件(包括博客草稿和PDF)可供公开访问。
- 此次泄露揭示了一个代号为“Capybara”的全新顶级AI模型,据报道,该模型在编码和推理方面表现出比当前旗舰产品Claude Opus 4.6更显著的性能提升。
- 内部文件将该模型描述为重大的网络安全风险,其攻击能力 “远超”任何现有AI,促使该公司采取谨慎的发布策略,首先专注于安全防御者。
