Coinbase 透過將大部分任務轉交給中國開源模型,將 AI 支出削減近半,挑戰了美國頂級 AI 供應商的定價能力。
Coinbase 透過將大部分任務轉交給中國開源模型,將 AI 支出削減近半,挑戰了美國頂級 AI 供應商的定價能力。

Coinbase 執行長 Brian Armstrong 表示,公司透過內部 LLM 閘道將中國開源模型 GLM 5.2 與 Kimi 2.7 設為預設選項,使 AI 支出削減近 50%,與此同時 Token 使用量仍呈指數級增長。
「91% 的工程師從未達到使用上限,所以我們沒有收緊配額——而是轉向了更便宜的預設模型,」Armstrong 週五在 X 平台上發文表示。
這家加密貨幣交易所實施了三項成本削減措施:一套智慧路由系統,可預先處理提示詞,並根據快取命中率與定價,將任務分配給最具成本效益的模型;積極的快取策略,將 LibreChat 的快取命中率從 5% 提升至 60%;以及上下文精簡機制,要求工程師在切換任務時開啟新會話。對於複雜的規劃與推理任務,工程師仍可調用前沿模型,而程式碼審查則採用多模型並行策略,由多個輸出相互校驗。
此舉驗證了中國開源 AI 在西方企業生產環境中的商業可行性,直接挑戰 OpenAI 與 Anthropic 等美國供應商的定價能力。對於 Coinbase 而言,在公司擴大 AI 使用而非限制之際,成本降低有助於改善利潤率與獲利指標。
智慧路由取代手動模型選擇
Armstrong 表示,公司自訂的排程架構會預先處理每個提示詞,然後根據快取命中機率與逐 Token 定價,自動將其路由至最合適的模型。他稱,目標是讓 AI 處理模型選擇,而非留給工程師決定。他認為,執行層級的任務並不需要最昂貴的前沿模型——只有規劃與推理任務才需要。
快取與上下文紀律驅動大部分節省
Coinbase 現在要求所有 AI 請求必須具備快取感知能力,亦即系統在生成新回應前,會先檢查是否能重複使用先前的回應。LibreChat 的實施說明了其影響:優化後快取命中率從 5% 躍升至 60%。Armstrong 也敦促工程師保持上下文精簡——開啟新會話、縮小檔案範圍、斷開未使用的工具——以減少浪費的 Token 消耗。
該公司尚未披露絕對支出數字。但在 Token 使用量呈指數級增長的同時實現近 50% 的減幅,這表明 Coinbase 已將消耗與成本部分脫鉤。
這對 AI 市場意味著什麼
採用北京智譜 AI 開發的 GLM 5.2 與北京月之暗面(Moonshot AI)開發的 Kimi 2.7 作為企業預設模型,標誌著中國開源 AI 進入西方企業基礎設施的一個里程碑。OpenAI 的 GPT-4o 與 Anthropic 的 Claude 4 定價高昂,如今面臨一個可信的低成本替代方案,企業可在不犧牲常規任務品質的前提下進行部署。
對投資人而言,訊息十分明確:如果其他大型企業效仿 Coinbase 的做法,美國高階 AI 模型的可服務市場可能僅限於高複雜度任務,從而壓縮那些依賴全面企業採用的供應商的營收成長預期。在那斯達克以代碼 COIN 交易的 Coinbase 尚未披露確切的節省金額,但隨著 AI 使用規模擴大,這項結構性成本改善將支撐利潤率擴張。
本文僅供資訊參考,不構成投資建議。