美國出口管制已推動中國AI晶片產業遠離輝達的通用GPU,轉向客製化晶片,形成一個結構上截然不同的半導體生態系統。
美國出口管制已推動中國AI晶片產業遠離輝達的通用GPU,轉向客製化晶片,形成一個結構上截然不同的半導體生態系統。

中國AI晶片產業已放棄複製輝達通用型GPU的努力,轉而投向客製化ASIC——一種犧牲靈活性以換取原始效率的方案。這一結構性轉變,因美國持續的出口管制封鎖了最先進美國處理器的取得管道而加速推進。
「具備強大AI工程能力且路線圖清晰的企業,能從ASIC中獲益;而運行混合工作負載的企業,仍傾向於使用通用型GPU,」Omdia首席分析師蘇連傑表示。
根據摩根士丹利5月8日發布的報告,華為技術預計將在2026年佔據中國國內AI加速器市場62%的份額,緊隨其後的是寒武紀科技,佔14%。百度和阿里巴巴集團各自預計在建設自有晶片的大型科技公司中,佔約5%的份額。華為預計其AI晶片收入將從2025年的75億美元,增長至2026年的約120億美元。輝達在中國AI加速器市場的佔有率實際上已跌至零,執行長黃仁勳稱此發展對美國而言是「可怕的結果」,因為它打破了軟體對輝達CUDA生態系統的依賴。
這種分歧對投資者而言具有長期影響。如果中國AI行業標準化為華為神經處理單元、阿里巴巴並行處理單元及寒武紀領域專用晶片的組合——各自運行自身的軟體堆疊——結果將形成一個分散但國內自給自足的生態系統,其運作架構假設與輝達主導的西方世界根本不同。輝達耗時二十多年建立的CUDA鎖定效應,正面臨其首次可信的挑戰。
三種架構,同一個方向
中國企業正致力於三種不同的ASIC設計。華為押注神經處理單元,推出其昇騰系列,包括廣泛部署的910C及即將推出的昇騰950。寒武紀正在通過其思元590及690系列構建領域專用架構。阿里巴巴的半導體事業部平頭哥,在上週的年度雲端運算峰會上推出了鎮武M890並行處理單元,號稱性能是前代產品的三倍。
在GPU方面,由輝達前中國區高管張建中於2020年創立的摩爾執行緒,正以MTT S5000系列等通用晶片引領國內努力。壁仞科技、燧原科技及沐曦集成電路也在競爭,但均未達到ASIC領導者的規模。
中國晶片與輝達符合出口規範的硬體之間,性能差距已顯著縮小。摩根士丹利數據顯示,華為的昇騰950及寒武紀的思元690,以每秒令牌數衡量,其性能可比輝達H20高出50%至150%。H20是輝達目前獲准向中國銷售的最強大晶片。根據外交關係委員會的一份報告,H20本身的性能約為輝達H200的六分之一。
軟體堆疊的挑戰
硬體性能只是方程式的一半。中國晶片行業面臨的更深層挑戰,在於打破輝達CUDA平台所建立的鎖定效應——這是全球數百萬AI開發者用來為輝達硬體編寫程式碼的軟體層。幾乎每個AI框架、每篇研究論文、每個預訓練模型,都假設CUDA相容性。
華為正在構建CANN作為其替代方案,而摩爾執行緒則開發了MUSA。DeepSeek已花費數月時間重寫其核心程式碼,以適應華為的CANN框架,逐步脫離CUDA生態系統。但半導體分析師張海軍指出,隨著AI模型日益複雜,客製化ASIC與靈活GPU之間的界線正「變得越來越模糊」,暗示最終勝出的架構可能會結合兩者的元素。
對於中國高度商業化的AI市場——其重點在於將應用部署給數億用戶,而非進行前沿研究——ASIC方法尤其合理。推理——即大規模運行已訓練模型的過程——獎勵的是客製化晶片所提供的狹義優化。訓練新模型仍受益於GPU的靈活性,但收入來自於部署。
這種分歧的長期後果,可能比近期的性能基準更為重大。如果中國AI行業標準化於國產晶片及軟體堆疊,當底層運算堆疊不相容時,跨境AI合作將變得更加困難。而缺乏單一主導平台意味著,沒有任何一家中國晶片製造商能夠享受到當年使輝達CUDA如此強大的生態系統鎖定效應。
輝達股票目前交易價格約為預期本益比的35倍,其來自中國的收入損失構成了結構性的懸念。儘管該公司的資料中心業務在全球仍占主導地位——上一財年創造了620億美元收入——但其中國業務的萎縮,消除了分析師此前視為多年順風的一個增長動能。投資者面臨的問題是,中國正在構建的客製化晶片生態系統,是否能跟上由輝達驅動的西方世界的創新步伐。
本文僅供資訊參考,不構成投資建議。