三位 Google 和 Meta 的資深員工已獲得 1 億美元資金,用於解決 AI 計算中的一個關鍵瓶頸,該瓶頸導致即使是最強大的晶片也處於閒置狀態。這家名為 Majestic Labs AI 的初創公司正在開發一種新型伺服器架構,旨在打破「記憶體牆」。這一問題一直困擾著數據中心,並導致輝達(Nvidia)等晶片製造商生產的高性能硬體浪費了數十億美元的效能。
該公司的使命是重新設計伺服器內的數據流,以跟上現代 AI 模型貪婪的胃口。創始人們指出:「巨大的 AI 模型正令伺服器不堪重負,並導致高性能晶片處於閒置狀態。」他們在 Alphabet 旗下的 Google 和 Meta Platforms 開發定制晶片時親歷了這一問題。
Majestic Labs AI 由 Ofer Shacham、Masumi Reynders 和 Sha Rabii 創立,他們此前曾負責 Google 數據中心晶片的研發,後來在 Meta Reality Labs 建立了定制晶片團隊。他們於 11 月宣布的 1 億美元融資計劃得到了 Bow Wave Capital、Lux Capital 和 Grove 等機構的支持。
這筆投資凸顯了整個 AI 行業面臨的一項嚴峻挑戰。隨著 AI 模型規模和複雜性的增長,運行成本也在不斷攀升,不僅體現在功耗上,還體現在潛力的浪費上。解決記憶體瓶頸可能會顯著提高 AI 計算效率,從而可能改變晶片設計師和雲端服務提供商的競爭格局。
十億美元級的交通擁堵
「記憶體牆」是計算領域長期存在的問題,但如今 AI 的規模使其進一步惡化。問題不在於像輝達 H100 GPU 這樣的晶片的處理能力,而在於向其輸送數據的速度。這造成了處理器等待數據的「交通擁堵」,浪費了時鐘週期和能源。這一問題是「維度災難」在實際應用中的體現——物理學家和數學家以此術語來描述隨著系統中變數的增加,計算成本如何呈指數級增長。
對於斥資數十億投入 AI 基礎設施的公司來說,這種效率低下直接打擊了利潤。配備了強大但利用不足的處理器的伺服器代表了巨額資本支出,但回報卻在遞減。根據 Flatiron 研究所的研究,克服這種維度咒詛是推動包括專用硬體在內的新型以數據為中心的計算方法發展的關鍵驅動力之一。
專為 AI 設計的新架構
雖然 Google 的張量處理器(TPU)和亞馬遜的 Trainium 晶片等競爭對手專注於設計更好的處理器,但 Majestic Labs 正從伺服器設計層面解決這一問題。該公司的方案雖然尚未完全公開細節,但暗示將對伺服器機架內記憶體與處理器的集成方式進行整體重新設計,旨在消除晶片之間存在的瓶頸。
這一戰略使該初創公司不僅要與輝達和 AMD 等成熟晶片製造商競爭,還要與其創始人前僱主 Google 和 Meta 的內部硬體項目一較高下。這些科技巨頭已投入巨資創建自己的定制晶片,以優化 AI 工作負載並減少對第三方供應商的依賴。Majestic Labs 能否成功,將取決於它能否提供一種不僅更高效,而且能廣泛兼容行業內各種硬體和軟件的解決方案。
本文僅供參考,不構成投資建議。