Key Takeaways:
- OpenAI 的 Codex 现在可以操作用户电脑上的任何应用程序,这是迈向自主 AI 代理的关键一步。
- 此次升级使 AI 从执行特定的预定义任务转向能够导航通用的计算机图形界面。
- 这一突破可能会颠覆传统的软件市场,并直接利好 OpenAI 的主要投资者微软。
Key Takeaways:

OpenAI 已升级其 Codex 模型,允许其控制用户电脑上的任何应用程序,此举推动行业向开发自主 AI 代理迈进。据财联社4月17日报道,此次更新标志着用户与软件交互方式的潜在转变,价值将从单个应用程序转移到可以操作它们的 AI 代理。
据报道,新版本的 Codex 不再局限于特定的集成或 API。相反,它可以像人类一样,通过图形用户界面 (GUI) 与软件进行交互。这一能力的实现代表了一个重大的技术障碍已被清除,这可能会加速传统软件即服务 (SaaS) 模式的颠覆,并对重金投资 AI 领域的公司产生看涨影响。
这一进展预示着未来 AI 代理可以跨不同程序执行复杂、多步骤的任务,而无需为每个程序进行自定义集成。这可以通过自动化目前繁琐的人工工作流来显著提高生产力。这一突破使 OpenAI 及其主要支持者微软 (MSFT) 在构建首个具备商业可行性的自主 AI 代理的竞赛中处于强势地位,该技术的潜在市场机遇预计达数千亿美元。
上一代 AI 工具主要通过应用程序编程接口 (API) 与其他软件交互。虽然这种方法很强大,但需要开发人员为每个应用程序创建特定的集成,从而限制了 AI 的灵活性。升级后的 Codex 似乎在 GUI 层面运行,通过观察像素并以类人的方式控制鼠标和键盘。这是一个更为复杂的挑战,需要对视觉数据和用户工作流有深刻的理解。
这种从基于 API 的集成到基于 GUI 的控制的跨越,是行业推动“AI 代理”(即能够代表用户进行推理、规划和执行任务的自主系统)的核心组成部分。虽然 OpenAI 尚未发布官方基准测试,但这一能力意味着该模型在推理和多模态理解方面取得了显著进步。它也为谷歌等其他主要参与者树立了新的竞争标杆,谷歌目前也在开发自己的代理式 AI 技术。
这一突破可能对 AI 板块高度看涨,特别是对于已向 OpenAI 投资超过 130 亿美元的微软。通过将这种水平的自动化直接集成到 Windows 操作系统中,微软可以建立起强大的护城河,并开辟以生产力为中心的新收入来源。该股票目前的远期市盈率约为 36 倍,随着市场计入 AI 驱动的整个企业效率提升的潜力,其估值可能会进一步攀升。
这一进展对估值约 6850 亿美元的 SaaS 行业构成了直接威胁。如果单个 AI 代理可以操作任何软件,价值可能会从底层应用转移到代理本身。这可能会压缩软件利润空间,并迫使商业模式进行根本性的重新思考。对于投资者而言,此番公告强调了支持基础模型开发商以及为其提供动力的基础设施提供商(如英伟达 NVDA)的重要性。盈利之路仍在界定中,但控制用户整个数字环境的能力是迈向该目标的重大一步。
本文仅供参考,不构成投资建议。