在人工智能競賽中,一股反向潮流正在興起:不再一味追求規模最大的模型,而是優先考慮效率最高的模型。
返回
在人工智能競賽中,一股反向潮流正在興起:不再一味追求規模最大的模型,而是優先考慮效率最高的模型。

商湯科技新一代「日日新 SenseNova 6.7 Flash-Lite」模型正在將 Token 消耗降低 60%,這標誌著行業正出現更廣泛的轉向:不再追求構建更大的 AI 模型,而是轉向能在成本和數據主權等現實企業約束下運行的系統。
「在亞洲,當我觀察 AI 熱潮時,主權的衡量標準已經超過了模型本身,」IBM 亞太區總經理 Hans Dekkers 在最近的一次採訪中表示。他指出,由於擔心數據洩露,99% 的企業數據仍未被 AI 觸及。
SenseNova 模型通過原生多模態架構實現其效率,該架構移除了中間的視覺到文本轉換層,直接解釋複雜的文檔和圖表。這與騰訊和 DeepSeek 等競爭對手模型中看到的暴力擴展形成了鮮明對比,轉而針對特定的高價值企業工作流。
此舉反映出一種日益增長的企業戰略,即部署數十個較小的專用模型,而非單一的全能模型。這種轉變創造了 AI 領域的新競爭陣地:能夠管理混合模型的編排平台,這也是 IBM 瞄準的市場,而像商湯科技這樣高效、低成本的模型可能會在此獲得巨大需求。
雖然市場大部分注意力都集中在基準測試性能上,但企業在嘗試部署大型通用 AI 時面臨著結構性錯配。監管碎片化,尤其是在亞太地區,使得數據主權成為主要的運營約束。企業通常不願將專有數據暴露給外部的單體模型,這為 AI 的採用創造了障礙。Dekkers 表示:「這並不是在合規與創新之間做選擇……而是關於在整個數字架構中保持控制權。」這種猶豫使得絕大多數有價值的企業數據處於孤島狀態,未被 AI 系統利用,這代表了一個巨大的、尚未開發的市場,需要能在這些邊界內運行的工具。
對高效、低功耗 AI 的需求正在為 GSI Technology 的 Didier Lasserre 所稱的「數十億美元市場」創造新機會。GSI 的 Gemini II 關聯處理器 (APU) 提供了一個清晰的案例研究。在最近的一項國防概念驗證中,該芯片僅使用 30 瓦的系統功耗,就實現了約 3 秒的首個 Token 生成時間,這是無人機監控的關鍵指標。這種在功率受限環境下的表現直接促成了合同簽署,並正被用於一個新的智慧城市項目。GSI 專用硬件的成功(其資金來自其傳統 SRAM 業務 22% 的增長)證明了構建針對延遲和效率而非原始規模的定制化 AI 解決方案的可行性,這正是商湯科技憑藉其輕量級模型所瞄準的市場利基。
商湯科技通過 SenseNova 6.7 Flash-Lite 採取的方法直接契合了這一新興範式。通過構建一個運行成本天生更低的模型——在信息搜索任務中削減了 60% 的 Token 使用量——該公司押注企業將更青睞成本節約和控制權,而非使用最大可用模型的虛名。這是向「自帶模型」環境發展的更大趨勢的一部分,在這種環境下,公司使用編排平台為每項特定任務部署最佳工具,無論是像 GPT-4 這樣的全球巨頭、阿里巴巴的地區性模型,還是專用的內部系統。在這種背景下,最有價值的參與者可能不是擁有最大模型的公司,而是為特定業務問題提供最高效、最合規解決方案的公司。
本文僅供參考,不構成投資建議。