騰訊正在將其 AI 戰略從單純追求參數規模轉向通過其新開源模型優化成本效益和現實任務的執行效率。
返回
騰訊正在將其 AI 戰略從單純追求參數規模轉向通過其新開源模型優化成本效益和現實任務的執行效率。

騰訊控股有限公司於 4 月 23 日發布了 Hy3 預覽版模型。這是一個擁有 2950 億參數的開源人工智能系統,標誌著騰訊的戰略重心已從追求純粹的規模轉向注重效率和實際應用。隨著國內 AI 競爭加劇,此次發布代表了這家中國科技巨頭的重大調整,重點是為複雜的現實任務創建一個具有成本效益的模型。
「Hy3 預覽版是混元大模型重構的第一步,」騰訊首席 AI 科學家、大語言模型團隊負責人姚順源在聲明中表示。「我們希望通過此次開源發布,獲得開源社區和用戶的真實反饋,以幫助提高 Hy3 正式版的實用性。」
新模型採用混合專家(MoE)架構,總參數量達 2950 億,但針對任何特定任務僅激活 210 億參數,並配備 256K 上下文窗口。這一設計旨在平衡高端能力與較低的運營成本。內部測試顯示,在 AI 智能體 CodeBuddy 和 WorkBuddy 等內部產品上,該模型的首字延遲降低了 54%,端到端耗時減少了 47%,成功率超過 99.99%。
此舉表明騰訊押注於:即使沒有業內最大規模的模型,憑藉卓越的工程能力和與其龐大產品生態系統的深度集成,也能獲得競爭優勢。與此同時,據報導,騰訊和競爭對手阿里巴巴集團正在洽談投資 AI 初創公司 DeepSeek,該公司尋求超過 200 億美元的估值。這表明騰訊正採取雙重戰略,在自主研發的同時,也在買入有前途的第三方技術。
Hy3 的發布標誌著騰訊 AI 理念的明顯轉變。該公司現在認為 3000 億參數區間是一個最佳平衡點,在此區間內,複雜推理和長上下文理解等核心能力可被充分解鎖,而進一步增加規模帶來的回報將遞減。這反駁了行業早期將不斷增加的參數量作為衡量模型實力的主要標準的觀點。
此次調整是在騰訊 AI 團隊重組及 2 月份建立新基礎設施之後進行的。目前的重點是能夠執行複雜工作流的「AI 智能體」,騰訊雲與智慧產業事業部 CEO 湯道生稱之為下一個範式。通過開源 Hy3 預覽版,騰訊旨在通過收集現實使用數據來加速其進化,為正式版的發布精煉模型。
騰訊的務實做法是在競爭激烈和資源受限的背景下提出的。訓練和擴展模型的高昂成本,加上美國對英偉達等公司先進半導體的出口限制,正迫使中國企業評估華為等供應商的國內替代方案。
在這種環境下,效率至關重要。據報導騰訊正在接洽的初創公司 DeepSeek,因以西方同行幾分之一的預算開發出強大的模型而聲名鵲起。騰訊在推出自身注重效率的 Hy3 模型的同時,尋求入股 DeepSeek,突顯了其兩手抓的戰略:為自身生態系統開發強大的集成化自有模型,同時通過投資接觸其他創新者,以對衝技術死胡同的風險。這種雙重方法的成功,對於在挑戰重重的中國 AI 市場中生存至關重要。
本文僅供參考,不構成投資建議。