AI 模型 API 的新型中间层市场正在兴起,在中国每日 Token 调用量激增 1,000 倍并突破 140 万亿次的推动下,形成了一个人工智能的“批发转零售”网络。
AI 模型 API 的新型中间层市场正在兴起,在中国每日 Token 调用量激增 1,000 倍并突破 140 万亿次的推动下,形成了一个人工智能的“批发转零售”网络。

AI 模型 API 的新型中间层市场正在兴起,在中国每日 Token 调用量激增 1,000 倍并突破 140 万亿次的推动下,形成了一个人工智能的“批发转零售”网络。
人工智能的商业化正在催生一个新的中间人阶层,即一个分发层,在这里,机器智能的基本单位像商品一样被购买、路由和转售。这种“代币经济学(Tokenomics)”市场正受到中国每日 AI 模型 API 调用量爆炸式增长的推动。根据华源证券的研究报告,该调用量已从 2024 年初的 1,000 亿次激增至 2026 年 3 月的超过 140 万亿次。这一新层级连接了上游模型厂商(如字节跳动和阿里巴巴)与碎片化的下游开发者及企业,为全球 AI Token 的流动创造了流动性基础设施。
华源证券分析师陈亮东在报告中表示:“Token 运营正在形成一个新的中间层市场,即探索 Token 分销模式,连接上游大模型厂商与下游开发者、企业和个人,本质是全球 Token 的批发到零售网络的流动性基础设施。”
这种增长受到 AI 消耗规模和中国模型竞争力不断提升的推动。2026 年第一季度,中国模型在热门路由平台 OpenRouter 上的周调用量首次超过了美国同类产品。在 2 月 16 日至 22 日期间,中国模型在调用量排名前五的模型中占据了四席,贡献了总量的 85.7%。像 OpenRouter(自 2025 年 10 月以来年化收入已增长五倍,突破 5,000 万美元)以及国内的硅基流动(Silicon Mobility)等平台,正在构建这一贸易的核心基础设施,提供统一的 API,允许开发者通过单一密钥访问数百种不同的模型。
这一新型 Token 经济反映了从云计算到加密支付等其他技术栈的演变,即基础设施和分发最终会捕获巨大价值。随着 AI 竞赛从资本密集型的模型训练转向为数十亿用户运行模型的运营挑战(这一过程被称为“推理”),新的竞争护城河变成了单次回答的成本。MiniMax 的 M2.5 等中国模型的输入成本仅为每百万 Token 0.30 美元,而 Claude 4.6 等模型的成本为 5 美元。这种高效路由工作负载的经济动机正在为这些新型 AI 经纪商创造价值数十亿美元的机会。
Token 分销业务不仅仅是加价转售 API 访问权限。虽然基础转售利润(如 OpenRouter 的 5.5% 溢价)提供了基础商业模式,但真正的价值是在技术栈的更上层创造的。最成熟的玩家正在开发专有的推理加速引擎,以降低运行模型的实际成本。例如,硅基流动声称其 SiliconLLM 和 OneDiff 技术可以将语言模型推理速度提高 10 倍,使其能够以仅为行业标准成本十分之一的价格提供 API 调用。
随着行业向“智能体 AI(Agentic AI)”迈进,对推理单位经济效益的关注变得至关重要。根据高盛的研究,这种自主、常驻的系统可能比目前的 AI 工具耗能高出 60 到 130 倍。这些智能体将处理从企业工作流到管理智能设备的各种任务,从而驱动对 AI Token 的持续、公用事业般的消耗。能够可靠且廉价地对这种消耗进行路由、计量和计费的平台,正将自己定位为 AI 经济中不可或缺的公用事业。这与加密货币领域的基础设施竞争如出一辙,Circle 和 Coinbase 等公司不仅在竞争发行稳定币,还在构建控制其流动的支付和结算轨道(如 Arc 和 Base)。
对于投资者而言,这一 Token 分销层的出现开辟了除了支持高知名度模型构建者之外的新途径。华源证券的报告确定了两个主要的投资逻辑:支持具备卓越模型能力的公司,如阿里巴巴、腾讯和字节跳动;以及支持拥有强大客户关系和高消耗场景的公司,特别是在营销、游戏和电子商务领域。易点天下(yodo)和蓝色光标(BlueFocus)等公司因其将基于 Token 的 AI 服务直接嵌入现有客户工作流的潜力而受到关注。
然而,该模式并非没有风险。基础 API 转售的技术门槛较低,这引发了激烈的竞争,可能会压缩利润空间。分销商还面临巨大的资金压力,因为他们通常需要向模型提供商预购容量,同时向下游客户提供更灵活的付款条件,从而产生坏账敞口。最重大的风险在于对上游模型提供商的依赖,后者控制着定价和准入。主要提供商的突然政策变化可能会瞬间瓦解分销商的业务,使得这一领域虽然处于高速增长,但也极具波动性。
本文仅供参考,不构成投资建议。