Coinbase通过将大部分任务路由至中国开源模型,将AI支出削减近一半,对美国高端AI提供商的定价能力构成挑战。
Coinbase通过将大部分任务路由至中国开源模型,将AI支出削减近一半,对美国高端AI提供商的定价能力构成挑战。

Coinbase首席执行官Brian Armstrong表示,该公司通过内部LLM网关将中国开源模型GLM 5.2和Kimi 2.7设为默认选项,使AI支出削减近50%,而代币使用量则持续呈指数级增长。
"91%的工程师从未触及使用上限,因此我们并未收紧配额——而是转向更便宜的默认模型,"Armstrong上周五在X平台上发帖称。
这家加密货币交易所部署了三项降本措施:一套智能路由系统,可对提示进行预处理并根据缓存命中率和定价将任务分配给最具成本效益的模型;激进缓存策略,将LibreChat的缓存命中率从5%提升至60%;以及上下文精简策略,要求工程师在切换任务时开启新会话。对于复杂的规划和推理任务,工程师仍可调用前沿模型,而代码审查则采用多模型并行策略,各输出结果相互交叉验证。
这一转变验证了中国开源AI在西方企业生产环境中的商业可行性,直接对OpenAI和Anthropic等美国供应商的定价能力构成挑战。对于Coinbase而言,在扩大AI使用而非限制使用的时期,成本削减有望改善利润率及盈利指标。
智能路由取代手动模型选择
Armstrong表示,公司的定制调度框架会对每条提示进行预处理,然后根据缓存命中概率和每代币定价自动将其路由至最合适的模型。他表示,目标是让AI处理模型选择,而不是留给工程师。他认为,执行层面的任务并不需要最昂贵的前沿模型——只有规划和推理任务才需要。
缓存策略与上下文纪律是节省成本的核心
Coinbase现在要求所有AI请求都具备缓存感知能力,即系统在生成新回复前会检查是否可以复用先前的回复。LibreChat的实施效果说明了这一点:优化后缓存命中率从5%跃升至60%。Armstrong还敦促工程师保持上下文窗口精简——开启新会话、缩小文件范围、断开未使用的工具——以减少浪费的代币消耗。
该公司尚未披露绝对支出数字。但在代币使用量呈指数级增长的情况下实现近50%的削减,表明Coinbase已在一定程度上将消耗与成本脱钩。
这对AI市场意味着什么
采用总部位于北京的智谱AI开发的GLM 5.2和月之暗面(Moonshot AI)开发的Kimi 2.7作为默认企业模型,标志着中国开源AI在西方企业基础设施中达到一个里程碑。OpenAI的GPT-4o和Anthropic的Claude 4定价高昂,如今面临一种可靠的低成本替代方案,企业可在不牺牲日常任务质量的前提下进行部署。
对投资者而言,信号十分明确:如果其他大型企业效仿Coinbase的做法,美国高端AI模型的可寻址市场可能将收窄至仅针对高复杂度任务,从而压缩那些依赖全面企业级应用的提供商的收入增长预期。在纳斯达克上市的Coinbase(代码COIN)尚未披露具体的成本节约金额,但随着AI使用规模扩大,结构性成本改善有助于利润率提升。
本文仅供参考,不构成投资建议。