前通義千問負責人承認「我們沒有做到盡善盡美」
林俊暘自離開阿里巴巴後首次公開發表聲明,對團隊過去的技術方向提出了坦誠的批評。他公開承認「我們沒有做到盡善盡美」,尤其針對將「思考」和「指令」模式融合到單一模型中的雄心勃勃的嘗試。這一策略最突出地體現在通義千問3模型上。
林俊暘解釋說,這種混合方法創造了一個妥協的系統。「思考」功能變得冗長且猶豫不決,而「指令」功能則失去了其直接性和可靠性,最終導致成本更高。阿里巴巴隨後於2025年下半年採取的行動也支持了這一評估,當時2507版本更新發布了獨立的「指令」和「思考」模型。林俊暘認為,儘管將兩種模式結合在概念上聽起來合理,但實際操作中難以調和它們不同的數據需求和行為目標,使得分離成為更具吸引力且更有效的商業部署途徑。
「智能體思維」被視為AI的下一個進化方向
林俊暘認為,以OpenAI的o1和DeepSeek-R1等模型為代表的「推理思維」時代,已基本完成了其使命。這些模型證明了複雜推理可以被訓練和規模化。他提出,現在的關鍵問題是接下來會發生什麼。他的答案是向「智能體思維」的根本性轉變——從僅僅「思考更長時間」轉向「為了行動而思考」。
這一新範式專注於訓練AI智能體,使其能夠在其環境的閉環中運行。「智能體思維」的主要特點包括能夠決定何時停止思考並採取行動,選擇和排序工具,處理來自真實世界的嘈雜反饋,以及在失敗後修訂計畫。這使得焦點從生成最終的靜態答案轉向在動態環境中維持有效、持續的行動。目標不再僅僅是一個正確答案,而是通過互動實現穩健高效的問題解決。
更廣闊的市場擁抱「為行動而思考」
林俊暘的願景與更廣泛的市場趨勢相符,即AI的價值通過其實際效用衡量。這一概念正獲得商業關注,例如初創公司Globeholder AI推出了其「思考實驗室」。該公司將其方法定義為「第二類智能」——能夠進行結構化分析和假設檢驗的系統——這直接呼應了林俊暘對目標導向推理的描述。
這一戰略演變正在進行中,阿里巴巴的通義千問和DeepSeek等中國開源模型正迅速挑戰ChatGPT等西方專有系統的主導地位。根據2026年3月的一份國會報告,中國模型在全球下載量和使用量中所佔份額日益增長。林俊暘作為中國最成功的開源項目之一的關鍵人物,倡導一種新的AI框架,為開發者如何構建更實用、更強大的應用提供了戰略路線圖,加劇了定義人工智能未來的全球競爭。