關鍵點:
- 包括 OpenAI 和 Google 在內的主要 AI 提供商正從僅限代幣的定價轉向針對搜索和運行時間等服務的多維計費。
- 企業 AI 成本現在很大程度上取決於具體任務,搜索密集型工作負載與推理密集型工作負載差異巨大。
- 這一變化給僅靠代幣價格競爭的提供商帶來了壓力,並創造了對新型 AI 成本管理和優化工具的需求。
關鍵點:

隨著包括 OpenAI、Google 和 Anthropic 在內的主要提供商超越簡單的按代幣定價,AI 經濟學正在發生根本性轉變。2026 年 4 月的一項行業分析顯示,這些公司引入了多維計費,對搜索、運行時間和緩存等服務分別收費,從根本上改變了企業計算和規劃 AI 預算的方式。
「未來將擴展到許可、IP 協議和基於結果的定價,」OpenAI 首席財務官 Sarah Friar 在 2026 年 1 月的一份聲明中表示,這標誌著公司正從單一的、基於使用量的 API 模型轉向戰略轉型。
這種新的定價格局已經顯現。Google 現在將「接地」(搜索增強)和上下文緩存列為單獨的計費項。Anthropic 在分層緩存乘數的基礎上,對會話運行時間收取每小時 0.08 美元的費用。OpenAI 的價格表則像一份資源菜單,對網絡搜索、按小時計費的容器使用以及按每天每 GB 計費的文件存儲分別收費。
對企業而言,結果是「每個代幣的成本」這一簡單指標現已過時。這種轉變可能會使原始 AI 模型推理商品化,給僅在代幣價格上競爭的提供商帶來壓力,同時為能夠有效整合高級服務並對其定價的平台創造競爭優勢。這種複雜性預計還將推動企業對新型 AI 成本管理和優化工具的需求。
AI 賬單的主要驅動因素不再是模型本身,而是正在執行的任務性質。對於 Google Gemini 2.5 Flash-Lite 上的輕量級、高頻檢索任務,單次調用的代幣成本可能僅為 0.0009 美元。然而,如果該調用包含超出免費額度的「接地提示詞」,僅接地費用就達 0.035 美元——幾乎是代幣成本的 40 倍。在這種工作負載中,搜索等外部工具佔據了發票的主要部分。
相反,對於使用 OpenAI GPT-5.4 等尖端模型進行的推理密集型編碼會話,代幣成本仍是主要因素。在 Anthropic 的 Opus 4.6 上進行一次包含 50,000 個輸入代幣和 15,000 個輸出代幣的會話成本為 0.625 美元,而相應的一小時會話運行費僅為 0.08 美元。這表明對於複雜的推理任務,模型本身仍然代表了總成本的很大一部分。公司現在必須分析其具體的用例來了解其總成本,因為通用的「AI 單位成本」已不復存在。
為了理解這種新的經濟模型,行業分析師提出了一個五層結算堆棧,描繪了價值如何被創造和計費。底層是效用層,包括計算、代幣、搜索和存儲等可衡量的資源。其上是用於互操作性的協議層,用於提示詞和技能等序列化專業知識的知識層,以及用於管理「數字勞動力」的執行層。
頂層是結果與責任層,計費直接與性能掛鉤。Intercom 針對每個「已解決」的客戶問題收費 0.99 美元,是這一趨勢的明確信號。隨著 AI 經濟的成熟,價值預計將向上層遷移。雖然底層效用層會像電力一樣商品化,但深度嵌入業務背景和問責機制的上層將獲得基於價值的優質定價。值得關注的關鍵信號是,企業合同何時開始減少對代幣價格的關注,而更多地關注服務級別協議和可驗證的結果。
本文僅供參考,不構成投資建議。