GPT-5.3-Codexが77.3%を達成、ライバルモデルを凌駕
OpenAIは、Anthropicとの直接対決に火をつけ、Anthropicが主力アップデートClaude Opus 4.6を発表した木曜日に、新しいプログラミングモデルGPT-5.3-Codexを同時リリースした。この同期リリースは、企業向けAIソフトウェア市場を巡る戦いにおける重大なエスカレーションを意味する。OpenAIは、新しいモデルがプログラミングエージェントの必須ターミナル操作スキルを測定するTerminal-Bench 2.0ベンチマークで77.3%のスコアを達成し、大きな飛躍を遂げたと主張している。これは、前身モデルと比較して13パーセントポイントの改善であり、AnthropicのOpus 4.6が報告した65.4%のスコアを大幅に上回っている。
ベンチマーク以外にも、OpenAIは著しい効率改善を強調し、新しいモデルは前身モデルの半分以下のトークンで推論速度を25%以上向上させたと述べた。業界にとってのマイルストーンとして、同社はGPT-5.3-Codexの初期バージョンが自社の開発、デバッグ、デプロイメントに使用されたことも明らかにした。OpenAIのサム・アルトマンCEOは、「5.3-Codexを使って5.3-Codexを構築するのを見るのは…未来への強力な一瞥だった」と述べた。
企業AI支出、1社あたり1,160万ドルに達する見込み、OpenAIのリード縮小
技術軍拡競争は、企業AI支出の爆発的な増加によって加速されている。Andreessen Horowitzの調査によると、大規模言語モデルに対する企業平均支出は2025年に700万ドルに達する見込みで、これは2024年の250万ドルから180%の増加である。この数字は2026年までにさらに65%増加し、1,160万ドルに達すると予測されている。この急速に拡大する「賞金プール」は、市場シェア競争を激化させている。
同じデータは、変化する状況を明らかにしている。OpenAIは依然として支配的なプレイヤーであるものの、企業AI支出におけるそのシェアは2024年の62%から2026年までに53%に減少すると予測されている。同期間中、Anthropicの市場シェアは14%から18%に増加すると予想され、Googleも市場のより大きな部分を獲得するだろう。この競争圧力は、最近アルトマンとAnthropicが広告戦略を巡って争ったように、ますます公になる競争を説明するのに役立つ。
OpenAI、Codexをコーダーから汎用エージェントへ拡張
OpenAIは、Codexを専門のプログラミングアシスタントから、広範囲の知識作業を処理できる多機能エージェントへと戦略的に再配置している。同社は、このモデルが現在、デバッグやデプロイメントからユーザー調査、スプレッドシートでのデータ分析まで、さまざまなタスクを管理できると述べ、MicrosoftやSalesforceのような企業が支配するより広範な企業生産性ソフトウェア市場への直接的な挑戦を示唆している。
その地位を強化するため、OpenAIはGPT-5.3-Codexを、ソフトウェアの脆弱性を特定するために特別に訓練されたサイバーセキュリティにおける「高能力」を持つ最初のモデルとしても指定した。採用と防御能力を加速するため、アルトマンはサイバーセキュリティ研究者向けに1,000万ドルのAPIクレジットを約束すると発表した。
これはビルダーの時代であり、彼らをコントロールしようとする人々の時代ではない。
— サム・アルトマン、OpenAI CEO