关键要点:
- DeepSeek V4正式版将于2026年7月中旬上线,实行峰谷API定价
- 高峰时段(上午9点至12点、下午2点至6点)价格将为正常费率的2倍
- 此举紧随DSpark发布,该技术将推理速度最高提升85%
关键要点:

DeepSeek将于7月中旬推出V4正式版,高峰时段API定价为正常费率的2倍。
定于7月中旬问世的DeepSeek V4正式版将在高峰时段向客户收取双倍费用——这一定价策略建立在该中国实验室相对于Anthropic和OpenAI已有成本优势的基础之上。
"峰谷定价让我们能够在高需求时段更高效地分配算力资源,"DeepSeek一位发言人表示,但未透露正式版的基础每token费率。
每日高峰时段为上午9点至12点及下午2点至6点,价格为非高峰时段的2倍。据德意志银行分析师Jim Reid称,V4-Pro模型每次前向传播激活其1.6万亿总参数中的490亿个参数,在执行同等任务时成本约为Anthropic Claude Fable 5的1.5%。
这一定价举措紧随DeepSeek于6月27日发布DSpark之后。DSpark是一种投机性解码框架,无需硬件升级即可将V4-Flash的生成速度最高提升85%。对于大规模运行V4的企业而言,更快的推理速度加上分级定价,可能进一步降低每token成本——在美国模型提供商预期IPO之前挤压其利润率。
正式版的发布标志着一段快速迭代期的收官。根据内部生产数据,DeepSeek的DSpark框架相比之前的MTP-1基线,将V4-Flash的每用户生成速度提升了60%至85%,V4-Pro提升了57%至78%。该公司还在MIT许可证下开源了DeepSpec——即投机性解码草稿模型的完整训练栈——使使用Qwen3和Gemma模型的团队也能获得该技术。
中国AI实验室加码定价压力
DeepSeek并非唯一挑战美国定价的玩家。Z.ai(原智谱AI)本周推出了GLM5.2——杰富瑞策略师Christopher Wood称其为"在企业市场几乎与Anthropic同等水平的竞争对手",而成本仅为后者的四分之一。摩根士丹利交易员指出,"需求结构正明显向低成本模型转移。"
峰谷机制可能进一步拉大DeepSeek在非高峰时段的成本差距,彼时费率将降至高峰水平的一半。德意志银行的Reid在6月18日写道,对于约90%的日常任务而言,DeepSeek V4-Pro"以Anthropic Claude Fable 5约1.5%的成本完成了基本相同的工作。"
这对投资者意味着什么
向廉价模型转型的趋势威胁着计划上市的美国AI提供商的估值叙事。据《纽约时报》报道,OpenAI因科技股IPO表现不佳以及日益加剧的价格竞争,正在重新考虑其IPO时间表。Anthropic也面临类似压力,企业客户正在评估更低成本的替代方案。
对于GPU制造商和云服务提供商而言,这一趋势是一把双刃剑。更低的每token成本可能推动更广泛的采用——德勤预计,推理工作负载将在2026年占所有AI计算量的约三分之二,高于2023年的三分之一。但如果企业将工作负载转移到更便宜或自托管的模型上,超大规模云服务商的收入增长可能放缓。DeepSeek的峰谷定价标志着AI价格战进入新阶段,中国实验室正利用软件优化和激进定价从美国现有玩家手中夺取市场份额。
本文仅供参考,不构成投资建议。