商湯科技戰略轉向：大幅削減 AI 成本 60% 棄大求精

商湯科技新一代「日日新 SenseNova 6.7 Flash-Lite」模型正在將 Token 消耗降低 60%，這標誌著行業正出現更廣泛的轉向：不再追求構建更大的 AI 模型，而是轉向能在成本和數據主權等現實企業約束下運行的系統。

「在亞洲，當我觀察 AI 熱潮時，主權的衡量標準已經超過了模型本身，」IBM 亞太區總經理 Hans Dekkers 在最近的一次採訪中表示。他指出，由於擔心數據洩露，99% 的企業數據仍未被 AI 觸及。

SenseNova 模型通過原生多模態架構實現其效率，該架構移除了中間的視覺到文本轉換層，直接解釋複雜的文檔和圖表。這與騰訊和 DeepSeek 等競爭對手模型中看到的暴力擴展形成了鮮明對比，轉而針對特定的高價值企業工作流。

此舉反映出一種日益增長的企業戰略，即部署數十個較小的專用模型，而非單一的全能模型。這種轉變創造了 AI 領域的新競爭陣地：能夠管理混合模型的編排平台，這也是 IBM 瞄準的市場，而像商湯科技這樣高效、低成本的模型可能會在此獲得巨大需求。

企業現實：數據主權勝過規模

雖然市場大部分注意力都集中在基準測試性能上，但企業在嘗試部署大型通用 AI 時面臨著結構性錯配。監管碎片化，尤其是在亞太地區，使得數據主權成為主要的運營約束。企業通常不願將專有數據暴露給外部的單體模型，這為 AI 的採用創造了障礙。Dekkers 表示：「這並不是在合規與創新之間做選擇……而是關於在整個數字架構中保持控制權。」這種猶豫使得絕大多數有價值的企業數據處於孤島狀態，未被 AI 系統利用，這代表了一個巨大的、尚未開發的市場，需要能在這些邊界內運行的工具。

效率挖掘出數十億美元市場

對高效、低功耗 AI 的需求正在為 GSI Technology 的 Didier Lasserre 所稱的「數十億美元市場」創造新機會。GSI 的 Gemini II 關聯處理器 (APU) 提供了一個清晰的案例研究。在最近的一項國防概念驗證中，該芯片僅使用 30 瓦的系統功耗，就實現了約 3 秒的首個 Token 生成時間，這是無人機監控的關鍵指標。這種在功率受限環境下的表現直接促成了合同簽署，並正被用於一個新的智慧城市項目。GSI 專用硬件的成功（其資金來自其傳統 SRAM 業務 22% 的增長）證明了構建針對延遲和效率而非原始規模的定制化 AI 解決方案的可行性，這正是商湯科技憑藉其輕量級模型所瞄準的市場利基。

商湯科技通過 SenseNova 6.7 Flash-Lite 採取的方法直接契合了這一新興範式。通過構建一個運行成本天生更低的模型——在信息搜索任務中削減了 60% 的 Token 使用量——該公司押注企業將更青睞成本節約和控制權，而非使用最大可用模型的虛名。這是向「自帶模型」環境發展的更大趨勢的一部分，在這種環境下，公司使用編排平台為每項特定任務部署最佳工具，無論是像 GPT-4 這樣的全球巨頭、阿里巴巴的地區性模型，還是專用的內部系統。在這種背景下，最有價值的參與者可能不是擁有最大模型的公司，而是為特定業務問題提供最高效、最合規解決方案的公司。

本文僅供參考，不構成投資建議。