Key Takeaways:
- OpenAI 的 Codex 現在可以操作用戶電腦上的任何應用程式,這是邁向自主 AI 代理的關鍵一步。
- 此次升級使 AI 從執行特定的預定義任務轉向能夠導航通用的電腦圖形介面。
- 這一突破可能會顛覆傳統的軟體市場,並直接利好 OpenAI 的主要投資者微軟。
Key Takeaways:

OpenAI 已升級其 Codex 模型,允許其控制用戶電腦上的任何應用程式,此舉推動行業向開發自主 AI 代理邁進。據財聯社4月17日報導,此次更新標誌著用戶與軟體交互方式的潛在轉變,價值將從單個應用程式轉移到可以操作它們的 AI 代理。
據報導,新版本的 Codex 不再侷限於特定的集成或 API。相反,它可以像人類一樣,通過圖形用戶介面 (GUI) 與軟體進行交互。這一能力的實現代表了一個重大的技術障礙已被清除,這可能會加速傳統軟體即服務 (SaaS) 模式的顛覆,並對重金投資 AI 領域的公司產生看漲影響。
這一進展預示著未來 AI 代理可以跨不同程序執行複雜、多步驟的任務,而無需為每個程序進行自定義集成。這可以通過自動化目前繁瑣的人工工作流來顯著提高生產力。這一突破使 OpenAI 及其主要支持者微軟 (MSFT) 在構建首個具備商業可行性的自主 AI 代理的競賽中處於強勢地位,該技術的潛在市場機遇預計達數千億美元。
上一代 AI 工具主要通過應用程式編程介面 (API) 與其他軟體交互。雖然這種方法很強大,但需要開發人員為每個應用程式創建特定的集成,從而限制了 AI 的靈活性。升級後的 Codex 似乎在 GUI 層面運行,通過觀察像素並以類人的方式控制滑鼠和鍵盤。這是一個更為複雜的挑戰,需要對視覺數據和用戶工作流有深刻的理解。
這種從基於 API 的集成到基於 GUI 的控制的跨越,是行業推動「AI 代理」(即能夠代表用戶進行推理、規劃和執行任務的自主系統)的核心組成部分。雖然 OpenAI 尚未發佈官方基準測試,但這一能力意味著該模型在推理和多模態理解方面取得了顯著進步。它也為 Google 等其他主要參與者樹立了新的競爭標杆, Google 目前也在開發自己的代理式 AI 技術。
這一突破可能對 AI 板塊高度看漲,特別是對於已向 OpenAI 投資超過 130 億美元的微軟。通過將這種水平的自動化直接集成到 Windows 操作系統中,微軟可以建立起強大的護城河,並開闢以生產力為中心的新收入來源。該股票目前的遠期市盈率約為 36 倍,隨著市場計入 AI 驅動的整個企業效率提升的潛力,其估值可能會進一步攀升。
這一進展對估值約 6850 億美元的 SaaS 行業構成了直接威脅。如果單個 AI 代理可以操作任何軟體,價值可能會從底層應用轉移到代理本身。這可能會壓縮軟體利潤空間,並迫使商業模式進行根本性的重新思考。對於投資者而言,此番公告強調了支持基礎模型開發商以及為其提供動力的基礎設施提供商(如輝達 NVDA)的重要性。盈利之路仍在界定中,但控制用戶整個數字環境的能力是邁向該目標的重大一步。
本文僅供參考,不構成投資建議。