AI推論は、2つの明確な形でメモリ需要を再形成している。 GPU HBMからSSDベースのストレージポッドへのKVキャッシュオフロードは、エンタープライズSSDに新たなサブ市場を創出し、一方でエージェンティックAIワークロードはCPU対GPUの比率を1:1へと押し上げ、LPDRAM需要を従来のサーバーメモリを超えて拡大させている。
AI推論は、2つの明確な形でメモリ需要を再形成している。 GPU HBMからSSDベースのストレージポッドへのKVキャッシュオフロードは、エンタープライズSSDに新たなサブ市場を創出し、一方でエージェンティックAIワークロードはCPU対GPUの比率を1:1へと押し上げ、LPDRAM需要を従来のサーバーメモリを超えて拡大させている。

AIトレーニングから推論への移行は、HBMをはるかに超える形でメモリ業界を再形成しており、KVキャッシュのオフロードとエージェンティックAIワークロードが、エンタープライズSSDとLPDRAM向けに2つの明確な成長市場を生み出している。
「AIのメモリシステムはストレージシステムを完全に変革する」と、Nvidiaの創業者兼CEOであるジェンスン・フアン氏は2026年6月のGTC Taipeiカンファレンスで述べ、メモリインフラはAIスタックの中で最も困難な部分の一つであると述べた。
この構造的なシフトは2つの力によって推進されている。第1に、推論ワークロードはKVキャッシュ需要の爆発的な増加を引き起こしている。KVキャッシュとは、プリフィルフェーズ中にキーバリューベクトルを保存し、デコード中の冗長な計算を回避する動的メモリである。Nvidiaのデータによると、クエリあたりの平均出力トークン数は2024年下半期以降、年間で5倍以上急増し、約30,000~40,000トークンに達している。GPUのHBM容量が枯渇すると、システムはキャッシュを破棄して再計算しなければならず、レイテンシと総所有コストが上昇する。
この問題を解決するため、Nvidiaは2025年3月にDynamoソフトウェアをリリースし、アクセス頻度の低いKVキャッシュをCPU DRAMやSSDを含むより安価なメモリ層にオフロードするようにした。2026年1月には、BlueField-4 DPUで管理されるCMX Context Memory Storage Platformを発表した。各ラックは64基のBlueField-4 DPUを使用して約9,600テラバイトの容量を管理し、ローカルSSDと共有ストレージの間に新たな「G3.5」ポッドレベルのコンテキストストレージ層を挿入する。2026年のComputexでは、NvidiaのBlueField-4 DPU構造モデルにすでにSK HynixのPEB210 E1.SおよびPE9010 M.2 SSDサンプルが組み込まれており、SSD PODサブ市場がコンセプトからハードウェアへと移行していることを示している。
エージェンティックAIがCPUメモリ需要を再形成
第2の推進力はエージェンティックAIである。この分野では、モデルが積極的に計画を立て、ツールを呼び出し、意思決定を行い、エージェントループを実行する必要がある。これらのタスクはすべてCPUが処理する。フアン氏は、エージェントはナノ秒単位の世界に生きており、超低レイテンシが最重要であり、CPUアーキテクチャの重要性が高まっていると述べている。
TrendForceの推計によれば、エージェンティックAIの導入が拡大するにつれ、CPU対GPUのワークロード比率は従来の1:4または1:8から約1:1へと移行し、CPU接続メモリに対する大幅な追加需要が発生する。エージェントワークロード向けに2026年に発表されたNvidiaのVera CPUは、最大1.5テラバイトのLPDDR5Xをサポートしており、これは前世代のGraceの3倍の容量である。
しかしTrendForceは、Nvidiaが次世代Vera RubinスーパーチップモジュールのSOCAMMメモリ容量を半減したと報じている。これは、2027年のサプライヤー予備生産計画においてNvidiaに割り当てられたLPDRAM容量が不足しているためである。この調整は、Nvidiaの全体的なメモリ需要の減少ではなく、短期的な供給制約を反映したものである。
より広範なCPU市場は、エージェンティックAIに向けた独自の世代交代を迎えている。IntelはXeon 6+(Clearwater Forest)を発表し、AMDはEPYC Veniceをリリース、ArmはArm AGI CPUを発表し、AmpereのAmpereOne MXは年内に生産開始が見込まれている。複数ベンダーによる競争は、業界全体のCPUメモリ需要の成長を加速させている。
投資への影響
メモリ投資家にとって、これらの2つのトレンドはHBMを超えた成長市場を示している。エンタープライズSSDは、Nvidia、Google、その他のプラットフォームベンダーがSSD PODアーキテクチャを展開する中、KVキャッシュオフロードによる新たな需要ベクトルを獲得している。LPDRAMは、エージェンティックAIがサーバーアーキテクチャをCPU-GPUのバランスの取れた構成へと押し上げる中、CPU側からの構造的な需要拡大を経験している。
NvidiaのVera Rubinで指摘された供給制約は、LPDRAMの短期的な容量が逼迫する可能性を示唆しており、LPDRAM生産の大部分を掌握するSK Hynix、Samsung Electronics、Micron Technologyなどの既存メモリメーカーに恩恵をもたらす。SSDメーカーにとっては、AIインフラにおける専用コンテキストストレージ層の出現は、2年前には存在しなかった新たなアドレス可能市場を表している。
本記事は情報提供のみを目的としており、投資助言を構成するものではない。