Key Takeaways:
- DeepSeek 已将其 API 更新至 100 万 token 上下文窗口,并将知识截止日期更新至 2025 年 5 月,向市场领导者发起挑战。
- 此次更新是在宣布推出新模型 DeepSeek V4 之前进行的,该模型预计将于 2026 年 4 月底发布。
- 此举通过为开发者提供大规模上下文 AI 能力,对谷歌、OpenAI 和 Anthropic 施加了竞争压力。
Key Takeaways:

中国 AI 挑战者 DeepSeek 已大幅将其主要 API 的上下文窗口增加至 100 万 tokens,这是其在与 OpenAI、谷歌和 Anthropic 的前沿模型竞争中的一次重大升级。这次未宣布的更新同时将模型的知识截止日期推后至 2025 年 5 月,使其开发者产品与面向消费者的应用程序保持一致,并标志着企业 AI 采用之战的新前线。
“我一直在研究 API,发现它现在和官方 App 没什么区别,”一位开发者在社交媒体平台上写道,反映了最早发现这一变化的社区反馈浪潮。“现在通过 API 就可以一次性处理整部《三体》三部曲了。”
此次更新取代了之前的 12.8 万 token 上下文窗口和 2024 年的知识截止日期。此举被广泛视为 DeepSeek V4 模型正式发布的先兆,创始人梁文锋曾在内部表示该模型将于 2026 年 4 月底发布。该公司尚未对 API 的变化做出正式回应。
这种激进的举措使一项直到最近还是顶级模型主要区别特征的功能变得平民化。通过 API 直接提供海量上下文窗口,DeepSeek 正直接向谷歌的 Gemini 3.1 Pro 和 Anthropic 的 Claude 系列等竞争对手的定价和功能施压,迫使它们捍卫其在高吞吐量企业工作流中的价值主张。
提供更大上下文窗口的竞赛是 AI 平台战争的一个关键维度。更大的上下文允许模型在单次运行中处理和推理海量信息,例如整个代码库、财务报告或文学作品。这种能力对于金融、法律和科学研究领域的复杂企业应用至关重要。
谷歌最近凭借基于 Gemini 3.1 Pro 模型的自主研究代理 Deep Research 和 Deep Research Max 引起了轰动。虽然谷歌的代理专注于将网络数据与私有企业信息融合,但 DeepSeek 的举措核心在于提供原始的大规模上下文能力作为开发者工具。此次更新使 DeepSeek 与 Anthropic 产生了直接竞争,后者也已将大上下文窗口作为其产品的核心部分。开发者面临的关键问题将是质量、延迟和成本之间的权衡,因为长上下文下的性能可能会下降。一些开发者指出,更新后的 API 性能感觉与 DeepSeek 的“fast”模型相似,暗示了扩展窗口可能带来的性能权衡。
此次更新解决了长期以来 DeepSeek 公开 App 比 API 提供更先进功能的差异,这一直是该平台开发者的挫败感来源。此次悄然推出引发了猜测,即该公司在为正式发布 V4 而升级底层模型的同时,暂时将 API 桥接到 App 的服务器上。
与此同时,据《The Information》报道,历来避免外部融资的 DeepSeek 据传正寻求以接近 100 亿美元的估值筹集资金。这笔资金注入将为在这场极其昂贵的 AI 军备竞赛中竞争提供必要的资源,因为训练一个前沿模型的 GPU 计算成本就可能高达数十亿美元。
对于投资者而言,DeepSeek 作为一个资金充裕且技术激进的竞争对手的出现,为行业格局增加了新的变量。虽然它是一家私营实体,但其行为可以通过迫使降价、加速创新节奏,并可能从寻找高性价比、高容量模型的开发者和企业客户手中夺取市场份额,从而影响上市的 AI 参与者。即将推出的 DeepSeek V4 将是测试其性能是否能真正挑战谷歌和 OpenAI 主导地位的关键。
本文仅供参考,不构成投资建议。