AI推理重塑内存需求，催生两大新增长市场

从AI训练到推理的转变正以远超HBM的方式重塑内存行业，KV缓存卸载与智能体AI工作负载为企业级SSD和LPDRAM创造了两个截然不同的增长市场。

"AI的内存系统将彻底改变存储系统，"英伟达创始人兼首席执行官黄仁勋在2026年6月的GTC台北会议上表示，他将内存基础设施称为AI堆栈中最具挑战性的部分之一。

这一结构性转变由两股力量驱动。首先，推理工作负载正在引发KV缓存需求的爆发式增长——KV缓存是一种动态内存，在预填充阶段存储键值向量，以避免解码阶段进行冗余计算。英伟达数据显示，自2024年下半年以来，每次查询的平均输出Token数每年增长超过五倍，达到约3万至4万个Token。当GPU高带宽内存容量耗尽时，系统必须丢弃缓存并重新计算，从而增加延迟和总拥有成本。

为解决这一问题，英伟达于2025年3月发布了Dynamo软件，可将较少访问的KV缓存卸载到更便宜的内存层级，包括CPU DRAM和SSD。2026年1月，该公司又推出了由BlueField-4 DPU管理的CMX上下文内存存储平台。每个机架使用64颗BlueField-4 DPU管理约9600TB的容量，在本地SSD和共享存储之间插入了一个全新的"G3.5"机架级上下文存储层。在2026年台北电脑展上，英伟达的BlueField-4 DPU结构模型中已包含SK海力士PEB210 E1.S和PE9010 M.2 SSD样品，表明SSD存储舱这一细分市场正从概念走向硬件。

智能体AI重塑CPU内存需求

第二个驱动因素是智能体AI，这类模型必须主动规划、调用工具、做出决策并执行代理循环——所有这些任务均由CPU处理。黄仁勋表示，智能体存在于纳秒级的世界中，超低延迟至关重要，这提升了CPU架构的重要性。

TrendForce估计，随着智能体AI部署规模的扩大，CPU与GPU的工作负载比例将从传统的1:4或1:8向约1:1转变，从而为CPU连接内存创造显著的新增需求。英伟达于2026年为智能体工作负载推出的Vera CPU，最高支持1.5TB的LPDDR5X内存，容量是上一代Grace的三倍。

不过，TrendForce报告称，英伟达已削减了下一代Vera Rubin超级芯片模块上的SOCAMM内存容量，原因是供应商2027年的初步生产计划中分配给英伟达的LPDRAM容量不足。这一调整反映出的是近期的供应限制，而非英伟达整体内存需求的下降。

更广泛的CPU市场也在为智能体AI进行自身的代际更新。英特尔推出了Xeon 6+（Clearwater Forest），AMD发布了EPYC Venice，Arm推出了Arm AGI CPU，而Ampere的AmpereOne MX预计将于今年投产。多供应商竞争正加速整个行业的CPU内存需求增长。

投资启示

对于内存领域的投资者而言，这两大趋势指向了HBM之外的增长市场。随着英伟达、谷歌及其他平台供应商推出SSD存储舱架构，企业级SSD正从KV缓存卸载中获得新的需求驱动力。LPDRAM方面，随着智能体AI推动服务器架构向CPU-GPU均衡配置发展，来自CPU侧的结构性需求正在扩张。

英伟达Vera Rubin所暴露出的供应限制表明，短期内LPDRAM产能可能偏紧，这将利好掌控大部分LPDRAM产能的成熟内存制造商，包括SK海力士、三星电子和美光科技。对于SSD制造商而言，AI基础设施中专用上下文存储层的出现，代表着一个两年前尚不存在的新增可寻址市场。

本文仅供参考，不构成投资建议。