DeepSeek 推出百萬級 Token API 更新挑戰 OpenAI

中國 AI 挑戰者 DeepSeek 已大幅將其主要 API 的上下文窗口增加至 100 萬 tokens，這是其在與 OpenAI、Google 和 Anthropic 的前沿模型競爭中的一次重大升級。這次未宣布的更新同時將模型的知識截止日期推後至 2025 年 5 月，使其開發者產品與面向消費者的應用程序保持一致，並標誌著企業 AI 採用之戰的新前線。

「我一直在研究 API，發現它現在和官方 App 沒什麼區別，」一位開發者在社交媒體平台上寫道，反映了最早發現這一變化的社區回饋浪潮。「現在通過 API 就可以一次性處理整部《三體》三部曲了。」

此次更新取代了之前的 12.8 萬 token 上下文窗口和 2024 年的知識截止日期。此舉被廣泛視為 DeepSeek V4 模型正式發布的先兆，創始人梁文鋒曾在內部表示該模型將於 2026 年 4 月底發布。該公司尚未對 API 的變化做出正式回應。

這種激進的舉措使一項直到最近還是頂級模型主要區別特徵的功能變得平民化。通過 API 直接提供海量上下文窗口，DeepSeek 正直接向 Google 的 Gemini 3.1 Pro 和 Anthropic 的 Claude 系列等競爭對手的定價和功能施壓，迫使它們捍衛其在高吞吐量企業工作流中的價值主張。

百萬級 Token 戰場升溫

提供更大上下文窗口的競賽是 AI 平台戰爭的一個關鍵維度。更大的上下文允許模型在單次運行中處理和推理海量信息，例如整個代碼庫、財務報告或文學作品。這種能力對於金融、法律和科學研究領域的複雜企業應用至關重要。

Google 最近憑藉基於 Gemini 3.1 Pro 模型的自主研究代理 Deep Research 和 Deep Research Max 引起了轟動。雖然 Google 的代理專注於將網絡數據與私有企業信息融合，但 DeepSeek 的舉措核心在於提供原始的大規模上下文能力作為開發者工具。此次更新使 DeepSeek 與 Anthropic 產生了直接競爭，後者也已將大上下文窗口作為其產品的核心部分。開發者面臨的關鍵問題將是質量、延遲和成本之間的權衡，因為長上下文下的性能可能會下降。一些開發者指出，更新後的 API 性能感覺與 DeepSeek 的「fast」模型相似，暗示了擴展窗口可能帶來的性能權衡。

從 API 差異到 V4 發射台

此次更新解決了長期以來 DeepSeek 公開 App 比 API 提供更先進功能的差異，這一直是該平台開發者的挫敗感來源。此次悄然推出引發了猜測，即該公司在為正式發布 V4 而升級底層模型的情況下，暫時將 API 橋接到 App 的服務器上。

與此同時，據《The Information》報導，歷來避免外部融資的 DeepSeek 據傳正尋求以接近 100 億美元的估值籌集資金。這筆資金注入將為在這場極其昂貴的 AI 軍備競賽中競爭提供必要的資源，因為訓練一個前沿模型的 GPU 計算成本就可能高達數十億美元。

對於投資者而言，DeepSeek 作為一個資金充裕且技術激進的競爭對手的出現，為行業格局增加了新的變量。雖然它是一家私營實體，但其行為可以通過迫使降價、加速創新節奏，並可能從尋找高性價比、高容量模型的開發者和企業客戶手中奪取市場份額，從而影響上市的 AI 參與者。即將推出的 DeepSeek V4 將是測試其性能是否能真正挑戰 Google 和 OpenAI 主導地位的關鍵。

本文僅供參考，不構成投資建議。