阿里巴巴實現自研AI GPU量產
阿里巴巴的晶片設計子公司平頭哥已開始量產其自主研發的圖形處理單元(GPU)。該公司宣布,該晶片旨在處理從大型模型密集訓練到微調和推理的大量工作的全範圍AI工作負載。新硬體兼容主流AI框架,增強了阿里巴巴的長期計算供應能力。
這一發展是阿里巴巴構建垂直整合AI堆棧戰略的基石。透過將其專有GPU與其通義千問大語言模型和雲計算基礎設施相結合,該公司旨在提供高性能、高成本效益的AI服務。此舉標誌著向技術自給自足邁出了關鍵一步,減少了對外國晶片供應商的依賴,並保護了其快速增長的雲業務免受地緣政治供應鏈風險的影響。
自研晶片威脅英偉達90%市場份額
阿里巴巴追求晶片獨立性是行業對英偉達市場主導地位廣泛反抗的一部分。儘管美國出口管制加速了中國國內晶片的研發工作,但即使是英偉達最大的美國客戶也在開發自己的替代方案。包括Google、微軟和Meta在內的科技巨頭正投入數百億美元開發定制AI加速器,以挑戰這家晶片製造商在AI硬體市場估計90%的份額。
主要驅動因素是成本。隨著AI工作負載轉向推理——即運行訓練模型的過程中——公司發現英偉達的通用GPU並非總是最適經濟的選擇。例如,Google專為特定目的構建的張量處理單元(TPU)據報導能夠提供比英偉達同類伺服器低30%-44%的總擁有成本。市場對這一趨勢的敏感度非常高;有報導稱Meta正在探索Google的TPU,導致英偉達在一次交易日中市值蒸發約2500億美元。
2030年推理工作負載將驅動75%的AI支出
向定制晶片的戰略轉變與人工智能不斷變化的經濟學直接相關。根據美國銀行分析師的說法,AI推理預計將從目前數據中心AI支出的約50%擴大到2030年的75%。阿里巴巴及其美國同行的專用晶片明確旨在優化這一高增長細分的性能和成本。
這一趨勢對曾經推動英偉達崛起的“一芯通用”模式構成了根本性挑戰。儘管英偉達正在透過多樣化其產品線來應對,但競爭格局正在迅速碎片化。隨著主要雲提供商和科技公司現在設計自己的晶片,提供更便宜、更高效的硬體以滿足迅速從訓練轉向大規模部署的市場需求,這場競賽正在進行中。