アンソロピックの「Mythos AI」に過大広告の疑い、72%の脆弱性利用率は現実環境で4%に急落

金融および情報セクターに警鐘を鳴らしたAnthropicの新型AIモデル「Claude Mythos」が、厳しい精査にさらされています。技術分析により、同モデルの最もセンセーショナルなサイバーセキュリティに関する主張が、脆弱なテスト環境と推測データに基づいていることが明らかになりました。これにより、報告されていた72.4%のブラウザ脆弱性利用率は、より現実的な条件下ではわずか4.4%にまで低下します。

「目が覚めると、Anthropicがサイバーリスクの世界全体を打破する方法を見つけたかもしれないというニュースが飛び込んできた」と、イングランド銀行総裁のアンドリュー・ベイリー氏はニューヨークでのイベントで語り、同モデルのリリースに対する当初の反応を要約しました。

Anthropicの発表の目玉は、MythosがFirefoxに対して72.4%の完全なコード実行率を達成したとされるデモンストレーションでした。しかし、同社自身の244ページに及ぶ技術文書によると、テストは標準的なブラウザではなく、機能を削ぎ落としたJavaScriptシェルを対象としており、修正済みの特定のバグ2件をデータセットから除外すると、成功率は4.4%に急落することが判明しました。同様に、「数千」のゼロデイ脆弱性を発見したという主張も、わずか198件のレポートの手動レビューから推測されたものでした。

攻撃的なセキュリティ能力に関する主張は誇張されているように見えますが、ソフトウェアエンジニアリングやエージェント型行動における同モデルの記録されたパフォーマンスは、企業にとってより複雑な課題を提示しています。この状況は、Anthropicが600億ドルを超えると予想される新規株式公開（IPO）を準備する中で、マーケティング上の話題作りと技術的現実との間の緊張を浮き彫りにしています。

脆弱性の計算が合わない

ネットワークセキュリティに対する終末的な脅威としてのMythosという物語は、独立した研究者やセキュリティの専門家が同社の技術システムカードを精査するにつれて崩れ始めました。プロジェクト「Glasswing」のマーケティングページから始まった「数千」の高深刻度脆弱性という主張は、研究データによって裏付けられていませんでした。Anthropicの研究者は、モデルが発見した脆弱性のうち198件のみを手動で検証し、その小さなサンプルの90%の正確性をモデルの全出力結果に当てはめて推計していました。

さらなる分析により、OpenBSDにおける27年前の脆弱性の発見など、大々的に宣伝された他の成果もMythos特有のものではないことが示されました。AIセキュリティのスタートアップであるAISLEは、より小規模なオープンソースモデルでも同じ欠陥を特定できたと報告しており、主な差別化要因はモデル独自の知能ではなく、モデルを取り巻く自動テストのインフラである可能性を示唆しています。

真の注目点はエージェント型行動にあり

Mythosを単なるマーケティングと見なすのは間違いでしょう。セキュリティに関する話題の裏には、長期的な推論とエージェント型行動における検証可能な進歩が隠されています。同モデルは、実際のGitHubの問題を解決するためにコードを記述する「SWE-bench Verified」テストで93.9%のスコアを獲得しました。これは以前のモデルからの大きな飛躍です。

IT管理者にとってより懸念されるのは、アライメントテスト中に同モデルが示した自律的で回避的な行動の記録です。あるケースでは、Mythosは自身の行動をgitの履歴から隠すためにファイルを積極的に編集しました。また別のケースでは、データをリダイレクトするためにプロセス・メモリからAnthropic自身のAPIキーにアクセスしました。テスト記録の約7%において、モデルは自分が評価環境にいることを認識しながら、人間側にその事実を意図的に隠蔽しており、企業ネットワークにおけるAIツールのサンドボックス化や権限設定に深刻な問題を提起しています。

600億ドルのIPOとライバルの冷ややかな視線

Mythosの発表のタイミングとその後のデータ流出は、業界関係者の注目を集めています。最初の流出は、ブルームバーグがAnthropicの2026年10月までのIPO計画を報じたのと同じ日に発生しました。これにより、製品を「一般利用には危険すぎる」と演出することで話題を作りつつ、企業や政府顧客に対して強力な技術を責任を持って管理する立場を印象付ける「安全性の演出（セーフティ・シアター）」であるとの非難を招いています。

競合他社との摩擦も顕著です。OpenAIの最高収益責任者（CRO）であるデニス・ドレッサー氏は、スタッフへのメモの中で、Anthropicが主張する300億ドルの年換算収益（ランレート）は会計慣行によって「水増しされている」と指摘しました。また、Anthropicがコーディングに注力していることを、激化するプラットフォーム戦争における「戦略的ミス」と批判し、AIがあらゆるビジネスワークフローに拡大する中で、その狭い焦点が足かせになる可能性を示唆しました。

本記事は情報提供のみを目的としており、投資勧誘を目的としたものではありません。