DeepSeek V4 以百萬級上下文窗口挑戰競爭對手

DeepSeek 的新型 V4 系列模型降低了推理成本並支持百萬級上下文，這種組合可能會加速企業從簡單的聊天機器人向複雜的自主 AI 智能體轉型。

中國 AI 公司 DeepSeek 發布了其 V4 系列模型，以一個支持百萬級上下文窗口且據稱成本大幅降低的系統向美國對手發起挑戰。此次發布加劇了中美之間的 AI 競爭，而在這之前，白宮指責中國實體企圖竊取美國的 AI 技術。

「這解決了長期以來與長上下文相關的性能較慢和成本較高的問題，標誌著行業的一個真正拐點，」技術研究機構艾媒諮詢（iiMedia）創始人張毅告訴法新社。

新系列包括兩個版本：用於處理複雜任務、擁有 1.6 萬億參數的 V4-Pro，以及更具經濟性的 2840 億參數的 V4-Flash。DeepSeek 聲稱 V4-Pro 的「世界知識」能力僅次於 Google 最新的 Gemini 模型。該系統還針對中國科技巨頭華為的芯片進行了優化，華為的 Ascend SuperPoD 產品正在為 V4 系列提供支持。

中金公司（CICC）的一份報告顯示，效率的提升預計將加速下游對 Agentic AI 的需求。該投資銀行表示，看好模型開發商智譜 AI（02513.HK）和 MiniMax（00100.HK），認為它們有望受益於技術的進步以及複雜、長期 AI 任務市場的擴張。

V4 架構旨在解決長上下文成本問題

V4 系列的核心創新在於一種混合注意力機制，旨在降低通常與大型上下文窗口相關的計算和內存成本。通過優化單標記推理 FLOPs 和 KV 緩存（KV Cache）使用，DeepSeek 旨在使百萬標記規模的模型在主流應用中具備商業可行性。

這種對效率的關注體現在其 API 定價上。根據公佈的費率，DeepSeek V4 Pro 模型每百萬輸入標記的價格為 $1.74 左右，輸出價格為 $3.48 左右。這使其在與其他高性能模型的競爭中處於優勢地位。相比之下，小米最近發佈的 MiMo-V2.5-Pro 輸入價格為 $1.00，輸出為 $3.00；而 Anthropic 強大的 Claude Opus 4.7 的輸入價格高達 $5.00，輸出價格為 $25.00。

Agentic AI 與開源推動競爭

DeepSeek 的戰略似乎專注於日益增長的 Agentic AI 領域。該公司表示，其 V4 模型針對 OpenClaw 和 CodeBuddy 等流行的 AI 智能體框架進行了優化，這些框架允許 AI 代表用戶自主完成複雜任務。這一細分市場競爭激烈，小米的 MiMo-V2.5-Pro 等模型在智能體基準測試中也表現出了極高的效率。

DeepSeek 戰略的一部分包括將其系統開源，這與 OpenAI、Google 和 Anthropic 的專有模型形成鮮明對比。這種方法推動了中國各市政府和企業的採用，但也引起了審查。白宮最近指責中國公司利用「工業規模的蒸餾活動竊取美國 AI」，北京稱這一指控「毫無根據」。DeepSeek 的開源方法，結合其性能表現和與國產硬件的兼容性，標誌著中國建設自給自足 AI 產業努力中的一個重要里程碑。

本文僅供參考，不構成投資建議。