Key Takeaways:
- OpenAI 联合创始人 Andrej Karpathy 宣布“软件 3.0”时代到来,这一以“代理工程”为核心的新范式据称可让专业开发者的生产力提升远超 10 倍。
- 物流巨头 C.H. Robinson 堪称现实案例,自 2022 年实施“精益 AI”战略并部署自定义 AI 代理以来,其货运效率提升了 50% 以上。
- 尽管代理提供了极高的速度,但企业正在实施“政策即代码”作为护栏以管控风险,这一必要步骤源于 AI 代理在商业模拟中犯下高昂代价错误的实验。
Key Takeaways:

OpenAI 联合创始人 Andrej Karpathy 认为,向“软件 3.0”的范式转变已经开始,AI 代理有望为专业开发者带来远超 10 倍的生产力提升。
OpenAI 联合创始人 Andrej Karpathy 表示,软件开发的一个根本性转变正在超越简单的代码补全,转向对功能强大但并非万无一失的 AI 代理进行复杂编排。这种他称之为“代理工程”的新范式已经在物流巨头 C.H. Robinson 产生了显著的生产力收益。自 2022 年实施“精益 AI”战略以来,该公司每人每日的货运量增加了 50% 以上。
Karpathy 在 4 月 29 日的一次采访中说:“人们过去常谈论‘10 倍程序员’,但 10 倍已不足以描述你获得的提速。在我看来,善于此道的人的产出远不止 10 倍。”
Karpathy 将这种新的专业标准与“氛围编程”(vibe programming)区分开来,后者是指每个人通过 ChatGPT 等工具获得的通用编程能力提升。他认为,代理工程的关键在于在利用 AI 代理巨大速度的同时,维持专业应用程序的质量和安全上限。他声称,这一转型在 12 月迎来了转折点,当时最新模型的能力使基于代理的工作流在处理复杂任务时真正变得可行。
向代理驱动开发模式的转变迫使公司构建“代理原生”基础设施,并重新评估人才招聘方式。正如 C.H. Robinson 拥有 450 人的 AI 团队所证明的那样,真正的竞争护城河不在于获取模型,而在于拥有引导模型有效实现业务目标所需的专有数据和应用层。
Karpathy 指出,当前 AI 的能力是“参差不齐的”。他举了一个例子:一个尖端模型可能发现软件漏洞,但也会建议用户走路去洗车房。他认为,成功应用 AI 的关键在于“可验证性”。在数学和编程等领域,AI 的输出可以轻松且自动地检查正确性,因此效果最好。这是前沿实验室集中进行强化学习努力的地方,从而创造了这种参差不齐的前沿。对于初创公司和投资者来说,这意味着最大的机会可能在于识别其他尚未被主要实验室用强化学习饱和的高价值、可验证的业务领域。
虽然 Karpathy 极力推崇代理的力量,但企业正谨慎行事,实施硬编码规则以防止代价高昂的错误。最近的一份《福布斯》报告强调了一个实验:一个名为 Claudius 的 AI 代理被指派运行一台自动售货机,结果很快就被诱导至破产。此类场景导致 31% 的企业将合规担忧列为扩展 AI 的主要障碍。
据受监管行业的专家称,解决方案是“政策即代码”。这种方法不是依赖可以被规避的自然语言提示,而是将确定的、机器可读的规则直接构建到系统中,使代理不可能违反这些规则。当代理遇到其政策边界以外的情况时,它会向人工上报,而不是即兴发挥。
向代理工程的转变并非理论,它正在变为现实。C.H. Robinson 的首席运营官 Arun D. Rajan 在公司最近的财报电话会议上解释说,拥有应用层是他们的关键竞争优势。Rajan 说:“获取 AI 本身并不是差异化因素,AI 的有效性取决于驱动它的数据和上下文。”
这一观点在整个行业得到了共鸣,即将举行的 QCon AI 波士顿大会设立了专门讨论“生产环境中的代理”、“生产级 AI 的上下文工程”以及“零信任代理系统”的分论坛。这些曾经的研究概念现在已成为大规模运营公司的核心工程问题。
在 Karpathy 看来,这都是向“软件 3.0”转型的一部分,届时神经网络最终可能成为主要处理器,而 CPU 则退居协处理器的地位。在这个未来中,人类最有价值的贡献将从执行转为判断。Karpathy 引用了一句令他印象深刻的话:“你可以外包你的思考,但你不能外包你的理解。”
本文仅供参考,不构成投资建议。