**AI推理正从两个不同维度重塑内存需求。**KV缓存从GPU高带宽内存卸载到基于SSD的存储舱,正在为企业级SSD创造一个新的细分市场;而智能体AI工作负载正将CPU与GPU的比例推向1:1,推动LPDRAM需求超越传统服务器内存。
**AI推理正从两个不同维度重塑内存需求。**KV缓存从GPU高带宽内存卸载到基于SSD的存储舱,正在为企业级SSD创造一个新的细分市场;而智能体AI工作负载正将CPU与GPU的比例推向1:1,推动LPDRAM需求超越传统服务器内存。

从AI训练到推理的转变正以远超HBM的方式重塑内存行业,KV缓存卸载与智能体AI工作负载为企业级SSD和LPDRAM创造了两个截然不同的增长市场。
"AI的内存系统将彻底改变存储系统,"英伟达创始人兼首席执行官黄仁勋在2026年6月的GTC台北会议上表示,他将内存基础设施称为AI堆栈中最具挑战性的部分之一。
这一结构性转变由两股力量驱动。首先,推理工作负载正在引发KV缓存需求的爆发式增长——KV缓存是一种动态内存,在预填充阶段存储键值向量,以避免解码阶段进行冗余计算。英伟达数据显示,自2024年下半年以来,每次查询的平均输出Token数每年增长超过五倍,达到约3万至4万个Token。当GPU高带宽内存容量耗尽时,系统必须丢弃缓存并重新计算,从而增加延迟和总拥有成本。
为解决这一问题,英伟达于2025年3月发布了Dynamo软件,可将较少访问的KV缓存卸载到更便宜的内存层级,包括CPU DRAM和SSD。2026年1月,该公司又推出了由BlueField-4 DPU管理的CMX上下文内存存储平台。每个机架使用64颗BlueField-4 DPU管理约9600TB的容量,在本地SSD和共享存储之间插入了一个全新的"G3.5"机架级上下文存储层。在2026年台北电脑展上,英伟达的BlueField-4 DPU结构模型中已包含SK海力士PEB210 E1.S和PE9010 M.2 SSD样品,表明SSD存储舱这一细分市场正从概念走向硬件。
智能体AI重塑CPU内存需求
第二个驱动因素是智能体AI,这类模型必须主动规划、调用工具、做出决策并执行代理循环——所有这些任务均由CPU处理。黄仁勋表示,智能体存在于纳秒级的世界中,超低延迟至关重要,这提升了CPU架构的重要性。
TrendForce估计,随着智能体AI部署规模的扩大,CPU与GPU的工作负载比例将从传统的1:4或1:8向约1:1转变,从而为CPU连接内存创造显著的新增需求。英伟达于2026年为智能体工作负载推出的Vera CPU,最高支持1.5TB的LPDDR5X内存,容量是上一代Grace的三倍。
不过,TrendForce报告称,英伟达已削减了下一代Vera Rubin超级芯片模块上的SOCAMM内存容量,原因是供应商2027年的初步生产计划中分配给英伟达的LPDRAM容量不足。这一调整反映出的是近期的供应限制,而非英伟达整体内存需求的下降。
更广泛的CPU市场也在为智能体AI进行自身的代际更新。英特尔推出了Xeon 6+(Clearwater Forest),AMD发布了EPYC Venice,Arm推出了Arm AGI CPU,而Ampere的AmpereOne MX预计将于今年投产。多供应商竞争正加速整个行业的CPU内存需求增长。
投资启示
对于内存领域的投资者而言,这两大趋势指向了HBM之外的增长市场。随着英伟达、谷歌及其他平台供应商推出SSD存储舱架构,企业级SSD正从KV缓存卸载中获得新的需求驱动力。LPDRAM方面,随着智能体AI推动服务器架构向CPU-GPU均衡配置发展,来自CPU侧的结构性需求正在扩张。
英伟达Vera Rubin所暴露出的供应限制表明,短期内LPDRAM产能可能偏紧,这将利好掌控大部分LPDRAM产能的成熟内存制造商,包括SK海力士、三星电子和美光科技。对于SSD制造商而言,AI基础设施中专用上下文存储层的出现,代表着一个两年前尚不存在的新增可寻址市场。
本文仅供参考,不构成投资建议。