Key Takeaways:
- 發生了什麼: AI 基礎設施公司棲景科技完成了數億元 Pre-A 輪融資,用於擴大其推理優化服務。
- 重要意義: 此次融資突顯了市場從資本密集型模型訓練轉向成本高效的模型部署(推理)的重大轉變,棲景科技聲稱可將成本降低高達 80%。
- 後續展望: 棲景科技將與阿里雲、華為雲等成熟雲巨頭以及其他初創公司展開競爭,爭奪日益增長的 AI 推理市場,這正成為新的競爭戰場。
Key Takeaways:

一家 AI 基礎設施初創公司獲得的大額早期融資,標誌著市場正從模型訓練的「暴力投入」轉向運行模型的經濟性。5 月 20 日,AI 基礎設施提供商棲景科技宣布完成數億元 Pre-A 輪融資,由星際資本(StarLink Capital)和華控技術領投,現有股東高瓴資本也參與了本輪融資。
在謹慎的風險投資市場中,這筆大額融資表明投資者的重點正在從「大即是好」的模型競賽轉移到商業部署的實際挑戰。市場目前正在獎勵那些能夠解決大規模使用 AI 模型(即推理)所產生的高昂且通常低效成本的公司。
棲景科技的核心觀點認為,行業對「模型即服務」(MaaS)的關注被誤導了。相反,它提供「Token 即服務」(TaaS),直接將 AI 輸出單元與成本聯繫起來。該公司針對 AI 部署中的一個關鍵效率瓶頸:硬體利用率。傳統的推理方法嚴重依賴昂貴的 GPU 顯存,導致系統中大量的 CPU 和標準 RAM 處於閒置狀態,整體硬體利用率通常低於 20%。棲景科技的「六合」架構和「閱兵」技術旨在通過重新設計 AI 處理的關鍵組件 KV Cache 的管理方式來解決這一問題,從而減少對昂貴 GPU 的依賴。該公司已為智譜 GLM 等主流模型提供推理服務,每天處理近萬億個 Token。
隨著 AI 行業開始面對規模擴張帶來的隱形成本,對效率的關注應運而生。雖然基於數萬億參數訓練的大語言模型(LLM)功能強大,但其運行成本高昂,且在許多任務中效率低下。一些企業發現,對於某些應用,更小、更緊湊的模型可以在性能和成本之間提供更好的平衡,響應速度比大型模型快 5 到 10 倍。這為能夠優化總擁有成本的基礎設施供應商創造了明確的商業機會,將關注點從前期模型成本擴展到包括維護、監控和能效在內的持續支出。
算力供需失衡加劇了對推理優化的需求。2026 年 3 月,騰訊雲、阿里雲和百度智能云等主要供應商上調了 AI 計算服務價格,部分模型成本漲幅超過 460%。這種環境為像棲景科技這樣的專業公司創造了巨大空間。
然而,該公司面臨著激烈的競爭。AI 基礎設施領域不僅包括 Silicon Flow 和 MoreThanAI 等初創公司,還包括實力雄厚的雲巨頭。阿里雲、華為雲和字節跳動的火山引擎都在構建全棧 AI 基礎設施能力。為了取得成功,棲景科技必須利用其資金建立足夠深的技术護城河,並在巨頭們縮小差距或提供能滿足大眾市場的「足夠好」的捆綁服務之前鎖住客戶。該公司的成功將取決於其在快速發展的行業中將技術優勢轉化為持續商業增長的能力。
本文僅供參考,不構成投資建議。