AlphaGo 背後的研究員 David Silver 籌集了 11 億美元的種子輪融資,其論點是 AI 行業的主流方法是錯誤的。
前 DeepMind 研究員 David Silver 的新初創公司 Ineffable Intelligence 已獲得 11 億美元的種子輪資金,直接挑戰了由 OpenAI 和谷歌擁護的大語言模型戰略。這家總部位於倫敦的公司旨在通過強化學習構建自學習 AI,並在歐洲初創公司有史以來規模最大的種子輪融資中達到了 51 億美元的估值。
「只有極少數——不到五個——的人做過真正的基礎性工作,」領投方紅杉資本的合夥人 Sonya Huang 表示,「Dave 就是其中之一。我從根本上同意他關於我們將從何處發現下一個重大突破的論點。」
本輪融資由紅杉資本和 Lightspeed Venture Partners 共同領投,英偉達、谷歌、Index Ventures 以及英國主權 AI 基金也提供了大量參與。對於一家於 2026 年 1 月正式成立且尚未推出產品的公司來說,如此巨額的融資凸顯了投資者為支持頂尖 AI 研究員而展開的激烈競爭。
這項投資代表了一場數十億美元的豪賭,即強化學習 (RL)——曾支持 AlphaGo 在圍棋領域取得成功的技術——是比在人類生成數據上擴展 LLM 更可行的通往超級智能之路。如果取得成功,Ineffable 的方法可能會顛覆目前由 LLM 主導的市場,並為 AI 發展創造一種新模式,儘管首批模型基準預計要到 2026 年底才會發佈。
對抗 LLM 的賭注
Silver 的論點與當前通過在海量人類生成的文本和圖像上訓練模型來實現人工智能的主流工業方法直接對立。他認為,雖然 LLM 功能強大,但它們從根本上受到人類數據這一「化石燃料」的限制。相比之下,他將自己專注於 RL 的方法描述為一種能夠「永遠無限」學習的「可再生燃料」。
Ineffable Intelligence 的願景是創建一個「超級學習者」,從其在複雜模擬中的自身經驗中發現知識,而不是簡單地掌握人類創造的信息。Silver 使用一個思想實驗來說明 LLM 的局限性:在一個相信地球是平的時代,基於歷史數據訓練的 AI 將仍然是一個「平地論者」,無法自行發現真相。然而,RL 智能體可以通過在模擬中運行自己的實驗來得出新的科學發現。
這種方法比在靜態數據集上訓練更具挑戰性,這在一定程度上解釋了為何需要如此巨大的資金注入,以建立足以與最大規模 LLM 訓練運行相媲美的模擬環境和計算基礎設施。
歐洲 AI 的分水嶺
這一輪融資的規模標誌著歐洲 AI 領域的一個分水嶺時刻,該領域在歷史上一直籠罩在舊金山實驗室的陰影之下。這是傑出研究員離開老牌巨頭創立自己公司這一更廣泛趨勢的一部分,其中包括 Mistral AI 的 Arthur Mensch,他同樣曾任職於 DeepMind。
對於英國來說,這項投資是一次象徵性的勝利,表明具有吸引力的論點的頂尖人才無需搬遷即可吸引巨額矽谷資金。然而,此舉並非沒有質疑者。Google DeepMind 首席執行官 Demis Hassabis 此前曾對初創公司在開發出產品或產生收入之前,以數十億美元的估值籌集巨額種子輪融資表示擔憂。
Ineffable Intelligence 符合這一描述,但投資者正在賭注於創始人的過往業績。Silver 在 DeepMind 的工作,從領導 AlphaGo 團隊到開發其繼任者 AlphaZero 和 MuZero,為其在不依賴預先存在的人類知識的情況下擴展智能的能力提供了有力且連貫的論據。擁有超過 10 億美元的資金,投資者的疑問在於,他能否將這種成功從棋盤遊戲的封閉世界轉化為現實的複雜性。
本文僅供參考,不構成投資建議。