AIスタートアップのAnthropicは火曜日、テクノロジーおよび金融大手12社との連合による「Project Glasswing」を立ち上げました。これは、未公開のClaude Mythos Previewモデルを導入して、重要なソフトウェアの脆弱性を発見し修正することを目的としています。この取り組みには、GoogleやMicrosoftといった競合他社に加え、CrowdStrikeやPalo Alto Networksなどのサイバーセキュリティ大手が参加しており、AIを悪用した脅威の先手を打つことを狙っています。
Anthropicのフロンティア・レッドチーム・サイバー・リード、ニュートン・チェン氏はインタビューで、「AIの進歩のスピードを考えると、このような能力が普及するのに時間はかからないでしょう。経済、公共の安全、そして国家安全保障への影響は深刻なものになる可能性があります」と語りました。
同社の発表によると、このモデルはすでに数千の欠陥を特定しており、その中には高度にセキュリティ対策が施されたOpenBSDオペレーティングシステムにある27年前の脆弱性や、FFmpegビデオライブラリにある16年前のバグが含まれています。CyberGym評価ベンチマークにおいて、Mythos Previewは83.1%を記録し、Anthropicの次点モデルであるClaude Opus 4.6の66.6%を大きく上回りました。
このプロジェクトは、2026年10月のIPOの可能性が報じられる中でAnthropicの年換算収益が300億ドルを突破する中、防御側に先制権を与えることを目的としています。Palo Alto NetworksやCrowdStrikeといったパートナーにとって、この取り組みは、サイバーセキュリティ分野を再編しつつあるAI主導の攻撃に対する、AIの防御能力の重要な試金石となります。先月、同モデルの能力に関するニュースを受けて、両社の株価は下落していました。
一般公開するには危険すぎるモデル
Anthropicは、Claude Mythos Previewの高度なサイバーセキュリティ能力を理由に、一般公開は行わないとしています。同社の内部テストでは、このモデルがLinuxカーネル内の複数の脆弱性を自律的に発見し連鎖させることで、一般ユーザー権限からマシンの完全な制御権まで昇格できることが示されています。コーディングベンチマークでのパフォーマンスも能力の差を浮き彫りにしており、SWE-bench Verifiedでは93.9%を記録し、Opus 4.6の80.8%を圧倒しました。
同社はパートナーに対して最大1億ドルの利用クレジットを提供することを約束し、情報開示プロセスを管理するためにLinux FoundationやApache Software Foundationを含むオープンソースセキュリティ団体に400万ドルを寄付しています。「かつて、セキュリティの専門知識は贅沢品でした」とLinux FoundationのCEO、ジム・ゼムリン氏は述べています。「Project Glasswingは、その状況を変えるための信頼できる道筋を提示しています」
セキュリティ不備の中での透明性への賭け
今回の発表は、3月に発生した内部文書を露呈させたCMSの設定ミスや、Claude Codeツールのソースコードを一時的に流出させたパッケージングエラーなど、Anthropicにとって当惑させるような複数のセキュリティ事案を受けたものです。同社は、これらは公開ツールの人的ミスであり、コアとなるセキュリティアーキテクチャの侵害ではないと述べていますが、パートナーに最強のモデルへの依存を求める中で、信頼性に関する疑問を投げかけています。
Anthropicは、このプロジェクトは必要な賭けであると主張しています。同社は、Mythos Previewのようなモデルの能力は数年ではなく数ヶ月以内に普及すると信じており、唯一の責任ある行動はまず防御側を武装させることだと考えています。これは、同様の攻撃ツールが不注意な者の手に渡る前に、今パートナーに限定的なアクセスを提供することで、より強固な防御を構築できるという賭けなのです。
この記事は情報提供のみを目的としており、投資助言を構成するものではありません。