Coinbase CEO称80%的AI工作负载将在18个月内转向便宜99%的模型

廉价、无限制的AI时代正在终结——一个两级智能市场正在浮现。

Coinbase首席执行官Brian Armstrong预测，80%的人工智能工作负载将在12至18个月内转向成本比当前前沿系统低99%的模型，原因是该行业正面临补贴式定价的不可持续性。

"限制因素将是能源和算力，而不是更好的模型，"Armstrong周日在X平台上发帖表示，他回应了投资者Tommy Shaughnessy的帖子，后者概述了按量API定价如何将企业AI支出推高至远超固定费率订阅让企业预期的水平。Armstrong表示，Coinbase已在适当情况下将提示路由至更便宜的模型，从而在Token使用量呈指数级增长的情况下，将AI成本维持在"大致持平"的水平。

这位Coinbase首席执行官的预测出炉之际，微软旗下的GitHub Copilot于6月1日从固定订阅模式转为基于Token的计费模式，导致部分用户账单增幅高达1700%。一名用户发布内部成本估算显示，其月费从44.68美元跃升至754.29美元，另一名用户则预计账单将达到847美元。此次定价改革反映了一场更广泛的清算：据Shaughnessy称，OpenAI的运营利润率接近负122%，意味着该公司完全依赖外部资本来补贴GPU采购和推理成本。

两级智能市场

Armstrong的框架将AI使用分为两类。剩余的20%需要峰值性能的工作负载——包括科学研究、智能体编排以及他所说的"智商最大化"——将继续运行在Anthropic的Opus 4.8或OpenAI的GPT-5.5等前沿模型上。其余80%将转向更便宜的替代方案，他将这种动态比作消费硬件领域——大多数买家不会选择MacBook和游戏PC的最高配置。

经济数据已经支持这种分化。据Shaughnessy称，DeepSeek V4在SWE-bench编程基准测试中的表现与Anthropic的Claude Opus相当，但成本仅为后者的约三十分之一。Hugging Face首席执行官Clement Delangue援引斯坦福大学的研究表示，在真实世界对话和推理查询中，本地模型的准确率已从2023年的23.2%上升至71.3%，而能耗和API调用成本仅为原来的零头。

Box首席执行官Aaron Levie称Armstrong"99%"的说法"有点极端"，但他同意AI使用将出现分层——高端工作由领先模型承担，高吞吐量任务则由廉价模型完成。"智能分配将变得极其重要，"Harvey联合创始人Winston Weinberg写道。Glean联合创始人Tony Gentilcore称Armstrong的分析"一针见血"，并补充道"金融市场是唯一将Opus价格外推至无限规模的领域。"

投资视角

向更便宜模型的转变威胁着包括OpenAI、微软和Anthropic在内的高端AI提供商的收入模式——这些公司一直依赖补贴式订阅来建立市场份额。如果80%的工作负载迁移至低成本替代方案，前沿模型的可寻址市场将急剧缩小。能够实现低成本推理的公司——包括开源模型提供商和路由基础设施商——将从中受益。英伟达的H100和B200 GPU为大多数前沿模型训练提供算力，其面临的前景更加复杂：算力需求可能会增长，但随着廉价替代品的普及，定价能力可能会被削弱。

本文仅供参考，不构成投资建议。