DeepSeek 450 亿美元估值预示 10 万亿美元 AI 硬件格局巨变

中国 AI 挑战者 DeepSeek 正在利用技术效率优势，针对当前 AI 硬件市场策划长期战略布局，并以旗舰模型永久降价 75% 拉开序幕。

据报道，中国 AI 初创公司 DeepSeek 正利用新一轮 700 亿元人民币融资带来的 450 亿美元投前估值，将其旗舰模型 V4-Pro 的价格永久下调 75%。此举是一项旨在削减竞争对手优势并减少对西方高端硬件依赖的战略举措。

“我们的原则是不亏损，但也不赚取超额利润，”DeepSeek 创始人梁文锋在两年前曾表示。如今，这一理念正随着公司在键值缓存（KV Cache）等领域的技术效率提升而成为现实，从而实现了大幅降低的成本结构。

该公司周六宣布，V4-Pro API 的价格现在将永久固定在其促销价，即每百万 Token 0.025 至 6 元人民币（约 0.0035 至 0.83 美元），较 24 元的峰值大幅下降。这得益于技术创新将 100 万 Token 上下文的 KV Cache HBM 内存需求降低至仅 5.48GB，而部分竞争对手模型则需要 60GB。

DeepSeek 的战略不仅限于 API 价格战，还旨在重构估值达 10 万亿美元的硬件供应链。通过针对较便宜的 LPDDR 内存和 SSD 优化其模型，该公司正在为中国国产芯片开辟一条与英伟达等领导者竞争的可行路径，有望在由其助力创造的硬件市场中占据重要份额。

硬件棋局

DeepSeek 激进的定价策略是旨在最大限度降低硬件成本的一系列深层技术创新的直接结果。这一战略的核心在于大幅缩减键值缓存（KV Cache），即大语言模型中内存密集型的组件。通过将 V4 模型的 KV Cache 占用空间降至竞争对手的不到十分之一，DeepSeek 可以将这些数据从昂贵的高带宽内存（HBM）转移到更商品化的 SSD 和 NAND 闪存中。

这种效率在硬件栈中产生了连锁反应。来自 SGLang 团队的研究显示，比 HBM 便宜得多的 LPDDR 内存可以作为“权重暂存区”，根据需要流式传输模型参数，而 DeepSeek 的混合专家模型（MoE）架构非常适合这种方法。这种方法有效地用大量廉价的系统内存替代了昂贵的高性能 GPU 内存。对于因 EUV 光刻受限而在生产尖端 GPU 方面面临挑战的中国国产芯片产业来说，这是一项关键进展。它允许性能较低的处理器通过搭配更多内存来保持竞争力，这是一种绕过原始算力不足的“换道超车”策略。

此外，DeepSeek 还投资了跨硬件编译器框架 TileLang。这一软件层旨在抽象化硬件差异，使 AI 代码能够在各种平台上运行，从而规避将许多开发者锁定在英伟达硬件生态中的强大“CUDA 护城河”。

通向 AGI 之路

根据近期投资者会议的报告，尽管眼前的效果是颠覆了 AI 硬件市场，但创始人梁文锋表示，最终目标是追求通用人工智能（AGI）。硬件效率战略是实现这一长期目标的必要基础。

实现 AGI 可能需要大规模的训练，特别是使用强化学习（RL）和递归自我提升（RSI）等技术，在这些技术中，AI 通过试错进行学习和自我完善。这些方法在计算上是天文数字级别的，需要生成数万亿个 Token 和海量的“假设”场景建模。通过降低计算的基本成本，DeepSeek 使这些此前难以负担的训练运行在经济上变得可行。从 MoE 模型到 KV Cache 压缩，每一项创新都汇聚于同一个目标：让 AGI 训练的成本低到足以能够持续追求。

这让 DeepSeek 的融资和定价策略呈现出新的意义。该公司不仅仅是在销售 API 接口；它正在构建一个由硬件合作伙伴和投资者（包括宁德时代和官方背景基金）组成的联盟，以打造一个自给自足的 AI 供应链。对于投资者而言，赌注不在于一家软件公司，而在于一个战略核心，通过从根本上改变建设成本的经济方程，它可能会重塑全球 AI 势力的平衡。这使得 DeepSeek 不仅成为其他 AI 实验室的直接挑战者，也成为了包括英伟达在内的整个支撑当前 AI 热潮的硬件生态系统的挑战者。

本文仅供参考，不构成投资建议。