DeepSeek V4 以百万级上下文窗口挑战竞争对手

DeepSeek 的新型 V4 系列模型降低了推理成本并支持百万级上下文，这种组合可能会加速企业从简单的聊天机器人向复杂的自主 AI 智能体转型。

中国 AI 公司 DeepSeek 发布了其 V4 系列模型，以一个支持百万级上下文窗口且据称成本大幅降低的系统向美国对手发起挑战。此次发布加剧了中美之间的 AI 竞争，而就在此之前，白宫指责中国实体企图窃取美国的 AI 技术。

“这解决了长期以来与长上下文相关的性能较慢和成本较高的问题，标志着行业的一个真正拐点，”技术研究机构艾媒咨询（iiMedia）创始人张毅告诉法新社。

新系列包括两个版本：用于处理复杂任务、拥有 1.6 万亿参数的 V4-Pro，以及更具经济性的 2840 亿参数的 V4-Flash。DeepSeek 声称 V4-Pro 的“世界知识”能力仅次于谷歌最新的 Gemini 模型。该系统还针对中国科技巨头华为的芯片进行了优化，华为的 Ascend SuperPoD 产品正在为 V4 系列提供支持。

中金公司（CICC）的一份报告显示，效率的提升预计将加速下游对 Agentic AI 的需求。该投资银行表示，看好模型开发商智谱 AI（02513.HK）和 MiniMax（00100.HK），认为它们有望受益于技术的进步以及复杂、长期 AI 任务市场的扩张。

V4 架构旨在解决长上下文成本问题

V4 系列的核心创新在于一种混合注意力机制，旨在降低通常与大型上下文窗口相关的计算和内存成本。通过优化单标记推理 FLOPs 和 KV 缓存（KV Cache）使用，DeepSeek 旨在使百万标记规模的模型在主流应用中具备商业可行性。

这种对效率的关注体现在其 API 定价上。根据公布的费率，DeepSeek V4 Pro 模型每百万输入标记的价格为 $1.74 左右，输出价格为 $3.48 左右。这使其在与其他高性能模型的竞争中处于优势地位。相比之下，小米最近发布的 MiMo-V2.5-Pro 输入价格为 $1.00，输出为 $3.00；而 Anthropic 强大的 Claude Opus 4.7 的输入价格高达 $5.00，输出价格为 $25.00。

Agentic AI 与开源推动竞争

DeepSeek 的战略似乎专注于日益增长的 Agentic AI 领域。该公司表示，其 V4 模型针对 OpenClaw 和 CodeBuddy 等流行的 AI 智能体框架进行了优化，这些框架允许 AI 代表用户自主完成复杂任务。这一细分市场竞争激烈，小米的 MiMo-V2.5-Pro 等模型在智能体基准测试中也表现出了极高的效率。

DeepSeek 战略的一部分包括将其系统开源，这与 OpenAI、谷歌和 Anthropic 的专有模型形成鲜明对比。这种方法推动了中国各市政府和企业的采用，但也引起了审查。白宫最近指责中国公司利用“工业规模的蒸馏活动窃取美国 AI”，北京称这一指控“毫无根据”。DeepSeek 的开源方法，结合其性能表现和与国产硬件的兼容性，标志着中国建设自给自足 AI 产业努力中的一个重要里程碑。

本文仅供参考，不构成投资建议。