DeepSeek V4、AIコストを73%削減しエヌビディアの覇権に挑む

中国のスタートアップ DeepSeek による新しい AI アーキテクチャは、計算リソースを 73% 削減して 100 万トークンのモデルを実行することを約束しており、現在の AI ハードウェア市場を支えるコスト構造を直接的に脅かしています。同社は、新しい V4 モデルが、前モデルのわずか 27% の計算能力と 10% のメモリを使用して 100 万トークンのコンテキストを処理できると主張しています。これは、開発者のコストを大幅に下げ、エヌビディアやグーグルのような既存企業に対する競争を激化させる可能性のある構造的な変化です。

「今後、1M（100 万）コンテキストは DeepSeek のすべての公式サービスの標準構成になります」と同社は公式発表で述べました。この動きは、エヌビディアのジェンスン・フアン CEO が重大な障壁として強調してきた、大規模コンテキスト AI に伴う高コストに対する直接的な挑戦です。DeepSeek のベンチマークでは、一般知識においてグーグルの最先端のクローズドソースモデルにまだ遅れをとっているものの、その効率性の向上は AI 軍拡競争における恐るべき新たな脅威となります。

V4 モデルの効率性は、新しいハイブリッドアテンションアーキテクチャに由来します。100 万トークンのコンテキストでの単一トークン推論において、1 秒あたりの浮動小数点演算（FLOPs）で測定される計算負荷を、以前の V3.2 モデルのわずか 27% に削減します。メモリの主要なボトルネックである必要な KV キャッシュは、以前のバージョンのわずか 10% に削減されました。同社は 2 つのバージョンをリリースしました。1.6 兆個のパラメータを持つ V4-Pro モデルと、より小規模な V4-Flash モデルで、どちらもオープンソースの MIT ライセンスで提供されています。

投資家にとって、DeepSeek の突破口は現在の市場に対する潜在的な破壊を意味します。力まかせの計算能力への依存度を低くしたモデルを設計することで、同社はファーウェイの Ascend チップなどの代替ハードウェアの活路を切り開いています。これは、中国が独自の独立した AI スタックを構築しているというエヌビディア CEO 自身の警告とも一致しています。アリババやテンセントの支援を受け、200 億ドルを超える評価額を目指しているとされる DeepSeek は、そのコスト優位性がスケーラブルであることを証明し、広く採用されるようになれば、クラウドプロバイダーやチップメーカーの利益率を圧迫する可能性があります。

計算コストに対する構造的な攻撃

DeepSeek V4 の核心的な革新は、トランスフォーマーモデルの計算の核であるアテンションメカニズムを再設計するための 2 段構えのアプローチです。標準的なアテンションでは、すべてのトークンがシーケンス内の他のすべてのトークンとの関連性スコアを計算する必要があり、計算の複雑さが二次関数的に増大します。これは、100 万トークンのコンテキストウィンドウを商業化する上での主要な障壁でした。

DeepSeek のソリューションは、圧縮疎アテンション（CSA）と高度圧縮アテンション（HCA）を組み合わせています。CSA は、訓練可能なメカニズムを使用して、完全な計算を行うのに十分重要なトークン接続を学習し、すべてを計算する代わりに動的に疎な構造を作成します。HCA は、推論中に高価な GPU メモリに保持する必要があるデータである KV キャッシュを圧縮することで、メモリの問題に対処します。これらの革新を組み合わせることで、DeepSeek は従来のアーキテクチャと比較して、同じハードウェアで 3 〜 4 倍の同時実行ユーザーを処理できます。

ベンチマークが明らかにする特化型の脅威

DeepSeek V4-Pro の効率性が最大の特徴ですが、そのパフォーマンスベンチマークは、特化型の競合相手としての姿を描き出しています。このモデルは数学とコーディングに優れており、Codeforces ベンチマークで 3206 点を記録し、OpenAI やグーグルのモデルで報告されているスコアを上回りました。しかし、一般的な世界の知識や高度な推論テストでは遅れをとっています。SimpleQA-Verified ベンチマークでは、V4 は 57.9 点を記録し、グーグルの Gemini 3.1 Pro のスコア 75.6 点に大きく及びませんでした。

これは、DeepSeek がすべての面でフロンティアモデルを打ち負かそうとするのではなく、明確なリードを築ける特定の高価値な機能にリソースを集中させていることを示唆しています。この戦略は、オープンソースで低コストなアプローチと相まって、最初の数週間で Apple の App Store のダウンロードチャートのトップに躍り出るなど、米国の巨大 IT 企業の高価で独占的なモデルに代わるものへの強い市場の意欲を示しています。非米国製ハードウェアに最適化された強力でコスト効率の高いモデルの台頭は、エヌビディアのジェンスン・フアン氏が「わが国にとって恐ろしい結果」と表現したシナリオそのものであり、多くの人が予想したよりも早く展開しているようです。投資家にとっての重要な問題は、このアーキテクチャ上の利点がどれほど早く市場シェアと収益に結びつくか、そしてエヌビディアのような既存企業が、より効率的で多極化した AI ハードウェア世界の脅威に対抗するために自社のロードマップを適応させることができるかどうかです。

この記事は情報提供のみを目的としており、投資アドバイスを構成するものではありません。