AI 定價演進：超越代幣成本的五層體系

隨著包括 OpenAI、Google 和 Anthropic 在內的主要提供商超越簡單的按代幣定價，AI 經濟學正在發生根本性轉變。2026 年 4 月的一項行業分析顯示，這些公司引入了多維計費，對搜索、運行時間和緩存等服務分別收費，從根本上改變了企業計算和規劃 AI 預算的方式。

「未來將擴展到許可、IP 協議和基於結果的定價，」OpenAI 首席財務官 Sarah Friar 在 2026 年 1 月的一份聲明中表示，這標誌著公司正從單一的、基於使用量的 API 模型轉向戰略轉型。

這種新的定價格局已經顯現。Google 現在將「接地」（搜索增強）和上下文緩存列為單獨的計費項。Anthropic 在分層緩存乘數的基礎上，對會話運行時間收取每小時 0.08 美元的費用。OpenAI 的價格表則像一份資源菜單，對網絡搜索、按小時計費的容器使用以及按每天每 GB 計費的文件存儲分別收費。

對企業而言，結果是「每個代幣的成本」這一簡單指標現已過時。這種轉變可能會使原始 AI 模型推理商品化，給僅在代幣價格上競爭的提供商帶來壓力，同時為能夠有效整合高級服務並對其定價的平台創造競爭優勢。這種複雜性預計還將推動企業對新型 AI 成本管理和優化工具的需求。

成本現在取決於任務，而非代幣

AI 賬單的主要驅動因素不再是模型本身，而是正在執行的任務性質。對於 Google Gemini 2.5 Flash-Lite 上的輕量級、高頻檢索任務，單次調用的代幣成本可能僅為 0.0009 美元。然而，如果該調用包含超出免費額度的「接地提示詞」，僅接地費用就達 0.035 美元——幾乎是代幣成本的 40 倍。在這種工作負載中，搜索等外部工具佔據了發票的主要部分。

相反，對於使用 OpenAI GPT-5.4 等尖端模型進行的推理密集型編碼會話，代幣成本仍是主要因素。在 Anthropic 的 Opus 4.6 上進行一次包含 50,000 個輸入代幣和 15,000 個輸出代幣的會話成本為 0.625 美元，而相應的一小時會話運行費僅為 0.08 美元。這表明對於複雜的推理任務，模型本身仍然代表了總成本的很大一部分。公司現在必須分析其具體的用例來了解其總成本，因為通用的「AI 單位成本」已不復存在。

AI 價值的五層堆棧

為了理解這種新的經濟模型，行業分析師提出了一個五層結算堆棧，描繪了價值如何被創造和計費。底層是效用層，包括計算、代幣、搜索和存儲等可衡量的資源。其上是用於互操作性的協議層，用於提示詞和技能等序列化專業知識的知識層，以及用於管理「數字勞動力」的執行層。

頂層是結果與責任層，計費直接與性能掛鉤。Intercom 針對每個「已解決」的客戶問題收費 0.99 美元，是這一趨勢的明確信號。隨著 AI 經濟的成熟，價值預計將向上層遷移。雖然底層效用層會像電力一樣商品化，但深度嵌入業務背景和問責機制的上層將獲得基於價值的優質定價。值得關注的關鍵信號是，企業合同何時開始減少對代幣價格的關注，而更多地關注服務級別協議和可驗證的結果。

本文僅供參考，不構成投資建議。