摩根大通的一份新报告强调了中国 AI 领域日益扩大的性能差距,DeepSeek 的基础设施效率创造了新的低成本前沿。
摩根大通的一份新报告强调了中国 AI 领域日益扩大的性能差距,DeepSeek 的基础设施效率创造了新的低成本前沿。

摩根大通的一份报告发现,DeepSeek 的 V4 大语言模型具有结构性成本优势,正给中国 AI 竞争对手智谱 AI (02513.HK) 和 MiniMax-W (00100.HK) 带来压力。这份在 V4 模型发布三周后发布的分析报告指出,只有 DeepSeek 的专有基础设施才能以最高经济效率运行该模型,从而在这个快速增长的领域创造了新的竞争动态。
该银行的报告强调了该模型在处理前缀缓存重用、流量密度和计算分配方面的结构性第一方优势。摩根大通指出:“在缓存命中输入性能方面,DeepSeek 官方 API 与第三方云渠道之间存在约 40 倍的差距。”该机构得出结论,虽然模型权重可以分发,但底层的成本曲线却无法分发,这赋予了 DeepSeek 显著的优势。
根据 OpenRouter 的数据,DeepSeek V4 的推出并未导致 GLM 和 MiniMax 等竞争对手的使用量相应下降,这表明市场正在经历供应受限的增长,而非零和替代。报告将市场框架描述为:DeepSeek V4-Pro 定义了低成本前沿,而智谱 AI 的 GLM-5.1 则锚定了高偏好端,使得 MiniMax 的 M2.7 模型处于中间位置。
对于投资者,摩根大通给予智谱 AI 和 MiniMax-W “增持”评级,目标价分别为 950 港元和 1,100 港元。然而,报告强调,两家公司都必须加强其战略定位,以有效应对 DeepSeek 的成本效率竞争。
对于运营 Zhipu AI 模型的智谱 AI,摩根大通认为其盈利现在取决于能否扩大其模型领先地位。虽然其 GLM-5.1 目前在评估中领先于 DeepSeek 的 V4,证明了价格溢价的合理性,但这种领先优势必须进一步扩大。为了维持定价权,下一个 GLM 版本需要在复杂的、与工作流相关的任务(如基于智能体的编码和长上下文推理)中扩大其偏好优势,在这些任务中,重试成本和质量比原始 Token 成本更重要。如果做不到这一点,可能会将对价格敏感的客户流失给 DeepSeek。
激烈的竞争正值中国 AI 使用量持续激增之际。根据 OpenRouter 对 5 月 11 日至 17 日当周的最新估算,中国大模型的 Token 使用量是美国的 1.81 倍,标志着其连续第三周位居全球首位。中国模型的 Token 使用量记录为 7.693 万亿个,而美国模型的使用量为 4.24 万亿个。全球 Token 使用量排名前三的模型中有两个是中国模型,其中包括腾讯 (00700.HK) 的 Hy3 预览版,该模型的使用量环比飙升 210%,达到 2.66 万亿个 Token,位列第一。
与此同时,MiniMax 的基础设施主导型价值主张面临越来越大的压力。MiniMax 历来在吞吐量和延迟方面具有竞争力,现在必须应对 DeepSeek 的低成本、百万上下文 API 及其看似更高效的服务堆栈。摩根大通建议,MiniMax M2.7 模型的继任者需要证明其能够通过更少的循环和重试来降低总体成本,以保持其差异化。
本文仅供参考,不构成投资建议。