主要發現
人工智慧公司Anthropic的一個配置錯誤導致近3,000份內部文件洩露,從而揭示了一個名為“Claude Mythos”的強大新模型。儘管該模型代表了能力的“代際飛躍”,但該公司以其可能引發前所未有的網路攻擊為由,暫不向公眾發布。
- 內容管理系統(CMS)中的一個配置錯誤無意中使Anthropic近3,000份內部文件(包括部落格草稿和PDF)可供公開訪問。
- 此次洩露揭示了一個代號為“Capybara”的全新頂級AI模型,據報導,該模型在編碼和推理方面表現出比當前旗艦產品Claude Opus 4.6更顯著的性能提升。
- 內部文件將該模型描述為重大的網路安全風險,其攻擊能力 “遠超”任何現有AI,促使該公司採取謹慎的發布策略,首先專注於安全防禦者。
