Coinbase 採用中國開源模型，AI 支出削減近五成

Coinbase 執行長 Brian Armstrong 表示，公司透過內部 LLM 閘道將中國開源模型 GLM 5.2 與 Kimi 2.7 設為預設選項，使 AI 支出削減近 50%，與此同時 Token 使用量仍呈指數級增長。

「91% 的工程師從未達到使用上限，所以我們沒有收緊配額——而是轉向了更便宜的預設模型，」Armstrong 週五在 X 平台上發文表示。

這家加密貨幣交易所實施了三項成本削減措施：一套智慧路由系統，可預先處理提示詞，並根據快取命中率與定價，將任務分配給最具成本效益的模型；積極的快取策略，將 LibreChat 的快取命中率從 5% 提升至 60%；以及上下文精簡機制，要求工程師在切換任務時開啟新會話。對於複雜的規劃與推理任務，工程師仍可調用前沿模型，而程式碼審查則採用多模型並行策略，由多個輸出相互校驗。

此舉驗證了中國開源 AI 在西方企業生產環境中的商業可行性，直接挑戰 OpenAI 與 Anthropic 等美國供應商的定價能力。對於 Coinbase 而言，在公司擴大 AI 使用而非限制之際，成本降低有助於改善利潤率與獲利指標。

智慧路由取代手動模型選擇

Armstrong 表示，公司自訂的排程架構會預先處理每個提示詞，然後根據快取命中機率與逐 Token 定價，自動將其路由至最合適的模型。他稱，目標是讓 AI 處理模型選擇，而非留給工程師決定。他認為，執行層級的任務並不需要最昂貴的前沿模型——只有規劃與推理任務才需要。

快取與上下文紀律驅動大部分節省

Coinbase 現在要求所有 AI 請求必須具備快取感知能力，亦即系統在生成新回應前，會先檢查是否能重複使用先前的回應。LibreChat 的實施說明了其影響：優化後快取命中率從 5% 躍升至 60%。Armstrong 也敦促工程師保持上下文精簡——開啟新會話、縮小檔案範圍、斷開未使用的工具——以減少浪費的 Token 消耗。

該公司尚未披露絕對支出數字。但在 Token 使用量呈指數級增長的同時實現近 50% 的減幅，這表明 Coinbase 已將消耗與成本部分脫鉤。

這對 AI 市場意味著什麼

採用北京智譜 AI 開發的 GLM 5.2 與北京月之暗面（Moonshot AI）開發的 Kimi 2.7 作為企業預設模型，標誌著中國開源 AI 進入西方企業基礎設施的一個里程碑。OpenAI 的 GPT-4o 與 Anthropic 的 Claude 4 定價高昂，如今面臨一個可信的低成本替代方案，企業可在不犧牲常規任務品質的前提下進行部署。

對投資人而言，訊息十分明確：如果其他大型企業效仿 Coinbase 的做法，美國高階 AI 模型的可服務市場可能僅限於高複雜度任務，從而壓縮那些依賴全面企業採用的供應商的營收成長預期。在那斯達克以代碼 COIN 交易的 Coinbase 尚未披露確切的節省金額，但隨著 AI 使用規模擴大，這項結構性成本改善將支撐利潤率擴張。

本文僅供資訊參考，不構成投資建議。