Key Takeaways:
- 中國 GPU 廠商摩爾線程發布了全棧「雲邊端」 AI 平台,從銷售單一芯片轉向提供完整的軟硬件系統,旨在國內市場與英偉達競爭。
- 新發布的 MUSA SDK 5.1.0 現已兼容英偉達的 CUDA 12.8,並支持全部 3,194 個 PyTorch 算子,此舉旨在大幅降低開發者將項目遷移到摩爾線程硬件的成本和難度。
- 公司還推出了用於具身智能的 MT Lambda 仿真平台,通過在單芯片上集成渲染、物理模擬和 AI 計算來加速訓練,瞄準機器人和自動駕駛領域。
Key Takeaways:

中國 GPU 廠商摩爾線程正在從銷售芯片轉向交付完整的 AI 基礎設施,旨在抓牢因美國出口管制而面臨挑戰的國內市場。
中國 GPU 公司摩爾線程(Moore Threads)正在推出全棧「雲邊端」 AI 平台。通過提供一套旨在降低從英偉達 CUDA 生態系統遷移門檻的軟硬件集成系統,該公司直接挑戰了英偉達(Nvidia Corp.)在中國市場的統治地位。
「單卡性能是入門,系統能力決定了採購和復購,」該公司在 5 月 18 日發布會的新聞材料中表示。這標誌著摩爾線程從單純提供零部件到交付集成 AI 基礎設施的戰略轉型。
此次發布包括誇娥(Kua’e)千卡智算集群,該集群已經投入使用,在大模型訓練中實現了高達 60% 的模型算力利用率(MFU)。與之配套的是 MUSA SDK 5.1.0,它現已兼容英偉達的 CUDA 12.8,並支持全部 3,194 個 PyTorch 算子。
此舉使摩爾線程處於捕捉中國年度約 500 億美元 AI 市場份額的有利地位。由於美國的出口限制,英偉達進入該細分市場的渠道受到限制。如果成功,這一戰略可能會加速中國 AI 的自給自足,並挑戰英偉達在該地區的長期收入前景。在實施最嚴厲的管制措施之前,中國市場佔英偉達總營收的 13%,即 171 億美元。
摩爾線程的聲明標誌著其從硬件廠商向系統架構師的重大戰略演變。該公司的新產品矩陣建立在「三位一體」的方法之上:用於雲端 AI 訓練的誇娥集群、基於新款長江 SoC 的邊緣和終端設備產品,以及用於仿真的 MT Lambda 平台。這一集成組合旨在向大規模企業客戶證明,公司能夠交付並維護複雜的端到端 AI 工作流,這對於承擔多年期 AI 項目的客戶來說至關重要。
在邊緣側,公司推出了基於長江 SoC 的 E300 模組,該模組提供 50 TOPS 的異構 AI 算力,適用於需要低延遲局部推理的工業檢測、無人車和機器人等應用。通過提供從雲到端的統一架構,摩爾線程旨在簡化開發者構建混合 AI 應用的部署過程。
多年來,任何潛在的英偉達競爭對手面臨的最大障礙一直是 CUDA——英偉達自有的軟件平台,它已在 AI 開發社區中根深蒂固。摩爾線程正在正面應對這一挑戰。通過開源 vLLM-MUSA 並實現對流行框架 SGLang 的原生支持,該公司正致力於減少開發者脫離英偉達生態系統時面臨的摩擦。
這一努力旨在解決兼容性問題中的「長尾」挑戰,例如自定義算子內核和舊有的依賴項,這些問題往往會使遷移項目脫軌。雖然支持主流框架是基本要求,但確保一家公司過往的所有工程努力都能順利移植才是真正的考驗。摩爾線程對其 MUSA 軟件棧(包括自動遷移工具)的關注,是直接嘗試讓其 GPU 不僅可用,而且易於被那些主要受過英偉達工具培訓的開發群體所採用。
此次發布中最具前瞻性的組件或許是 MT Lambda 仿真平台,它將摩爾線程的 GPU 敘事推向了物理 AI 領域。隨著 AI 從數字空間轉向在機器人和自動駕駛中與物理世界互動,高保真仿真的需求變得至關重要。在現實世界中訓練這些系統成本高昂且具有危險性。
摩爾線程將其集成圖形渲染、物理模擬和 AI 計算於單芯片的「全功能 GPU」定位為此項工作的理想基礎。通過在虛擬環境中實現合成數據的高效生成和控制策略的驗證,該平台可能成為 Pony.ai(小馬智行)和智譜 AI 等合作夥伴的關鍵基礎設施。此舉不僅使摩爾線程在 GPU 硬件上與英偉達競爭,還直接挑戰了 Omniverse 等綜合仿真平台。
這一戰略並非沒有風險。通過將範圍從芯片擴展到全系統,摩爾線程現在在雲穩定性、開發者體驗和實際應用性能等多個戰線上同時開戰。然而,隨著美國限制為華為和摩爾線程等本土企業創造了潛在機會,深度嵌入中國 AI 建設的機會或許值得冒險。
本文僅供參考,不構成投資建議。