关键要点:
- Coinbase首席执行官Brian Armstrong预测,12-18个月内80%的AI工作负载将迁移至成本降低99%的模型
- GitHub Copilot于6月1日转为基于Token计费,部分用户账单从44美元飙升至800美元以上
- OpenAI运营利润率接近负122%,凸显补贴式AI定价的不可持续性
关键要点:

廉价、无限制的AI时代正在终结——一个两级智能市场正在浮现。
Coinbase首席执行官Brian Armstrong预测,80%的人工智能工作负载将在12至18个月内转向成本比当前前沿系统低99%的模型,原因是该行业正面临补贴式定价的不可持续性。
"限制因素将是能源和算力,而不是更好的模型,"Armstrong周日在X平台上发帖表示,他回应了投资者Tommy Shaughnessy的帖子,后者概述了按量API定价如何将企业AI支出推高至远超固定费率订阅让企业预期的水平。Armstrong表示,Coinbase已在适当情况下将提示路由至更便宜的模型,从而在Token使用量呈指数级增长的情况下,将AI成本维持在"大致持平"的水平。
这位Coinbase首席执行官的预测出炉之际,微软旗下的GitHub Copilot于6月1日从固定订阅模式转为基于Token的计费模式,导致部分用户账单增幅高达1700%。一名用户发布内部成本估算显示,其月费从44.68美元跃升至754.29美元,另一名用户则预计账单将达到847美元。此次定价改革反映了一场更广泛的清算:据Shaughnessy称,OpenAI的运营利润率接近负122%,意味着该公司完全依赖外部资本来补贴GPU采购和推理成本。
两级智能市场
Armstrong的框架将AI使用分为两类。剩余的20%需要峰值性能的工作负载——包括科学研究、智能体编排以及他所说的"智商最大化"——将继续运行在Anthropic的Opus 4.8或OpenAI的GPT-5.5等前沿模型上。其余80%将转向更便宜的替代方案,他将这种动态比作消费硬件领域——大多数买家不会选择MacBook和游戏PC的最高配置。
经济数据已经支持这种分化。据Shaughnessy称,DeepSeek V4在SWE-bench编程基准测试中的表现与Anthropic的Claude Opus相当,但成本仅为后者的约三十分之一。Hugging Face首席执行官Clement Delangue援引斯坦福大学的研究表示,在真实世界对话和推理查询中,本地模型的准确率已从2023年的23.2%上升至71.3%,而能耗和API调用成本仅为原来的零头。
Box首席执行官Aaron Levie称Armstrong"99%"的说法"有点极端",但他同意AI使用将出现分层——高端工作由领先模型承担,高吞吐量任务则由廉价模型完成。"智能分配将变得极其重要,"Harvey联合创始人Winston Weinberg写道。Glean联合创始人Tony Gentilcore称Armstrong的分析"一针见血",并补充道"金融市场是唯一将Opus价格外推至无限规模的领域。"
投资视角
向更便宜模型的转变威胁着包括OpenAI、微软和Anthropic在内的高端AI提供商的收入模式——这些公司一直依赖补贴式订阅来建立市场份额。如果80%的工作负载迁移至低成本替代方案,前沿模型的可寻址市场将急剧缩小。能够实现低成本推理的公司——包括开源模型提供商和路由基础设施商——将从中受益。英伟达的H100和B200 GPU为大多数前沿模型训练提供算力,其面临的前景更加复杂:算力需求可能会增长,但随着廉价替代品的普及,定价能力可能会被削弱。
本文仅供参考,不构成投资建议。