核心要点:
- 世界500强企业的人均AI成本已达每月7500美元,引发大规模使用限额
- 微软正探索将DeepSeek V4作为Anthropic旗舰模型成本仅57分之1的替代方案,用于Copilot Cowork
- 微软、Databricks以及英伟达支持的Factory推出网关工具,成为AI成本控制的新型基础设施层
核心要点:

世界500强企业内部无限AI代币消费的时代正在终结,取而代之的是严格的预算、使用限额以及争相寻找更便宜模型的竞赛,原因是人均AI成本已飙升至每月7500美元。
AT&T已限制员工使用微软的GitHub Copilot。Meta收紧了在Anthropic及其他AI服务上的支出。Uber到4月份就用完了整个2026财年的AI编程预算,并将每位员工每款工具每月的使用费上限设为1500美元。沃尔玛对内部AI代理设置了限额。亚马逊则取消了根据AI使用量对员工进行排名的内部排行榜——此前发现员工为了提升排名而大量消耗算力。
据知情人士透露,从"代币最大化"(tokenmaxxing,即最大化AI代币消耗的做法)转向"代币最小化"(tokenminimizing)的逆转浪潮正席卷最大的企业级生成式AI用户。据The Information报道,在AI使用最密集的公司,人均月AI成本已达7500美元,这一数字迫使首席财务官们出手干预。
"企业正意识到,在统一费率定价下,智能体AI工作流无法实现规模化扩展,"Edgen企业AI分析师Alex Nguyen表示。"当一个AI智能体为了完成一项任务而串联50次模型调用时,这种算法在企业级体量下就无法运转了。"
人均7500美元的成本困局
这一结构性转变源于智能体AI工具的兴起——这类软件可自主串联多次模型调用,跨邮件、电子表格和即时通讯应用完成复杂任务。与手动聊天机器人查询不同,这些智能体以一种难以预测或限制的方式爆发式消耗代币。
根据微软内部审查的数据,该公司发现部分工程师仅Claude Code一项服务的代币费用每月就高达500至2000美元。自2023年以来,企业AI交互成本已飙升30倍,高盛预测智能体工作流可能使代币需求较当前水平增长24倍。
高端模型与开源模型之间的价差使这一矛盾更加尖锐。Anthropic最新旗舰模型的成本约为每百万代币50美元,而DeepSeek V4 Pro的运行成本约为每百万代币0.87美元——两者相差57倍,数据来自两家公司公布的定价信息。据Axios 6月16日报道,微软目前正在探索将经过微调并自托管的DeepSeek V4版本作为其Copilot Cowork产品的低成本后端方案。
并非每家公司都在收紧预算。Databricks对其工程师不设AI预算上限,该公司工程主管Nikita Shamgunov上周在Nebius的一场活动上表示。Box首席执行官Aaron Levie表示,他的公司从一开始就没有采纳代币最大化的做法。"我们根本没有排行榜,所以也就没有走偏,"Levie说。
新AI预算时代的守门人
成本控制浪潮正在催生新的基础设施需求。微软和Databricks各自推出了"网关"工具,用于监控员工的AI使用情况并强制执行支出限额。估值15亿美元的英伟达支持的企业Factory本月发布了一款模型路由器,可自动将低复杂度任务分配给更便宜的模型。
Palantir和Box的高管报告称,企业客户越来越希望将简单任务从昂贵的尖端模型转移到更便宜或开源的替代方案上。这一模式与十年前重塑云计算市场的从全高端向分层云计算的转变如出一辙。
微软首席执行官萨提亚·纳德拉将这一趋势定位为战略必需。"我们没有人想看到这样一个世界:每个行业中的每家公司都将价值拱手让给少数几个'赢家通吃'的模型,"他上周在X上写道。考虑到微软自身的生产力软件现在正与Anthropic和OpenAI在定价上展开竞争,这一评论颇具分量。
微软新推出的Copilot Cowork产品(已于6月16日正式全面上线)正是这一矛盾的体现。它要求用户每月支付30美元的Microsoft 365 Copilot许可证费用,再加上通过Copilot Credits按用量计费的附加费用——这种双重订阅加消费的定价模式与Anthropic的企业定价策略如出一辙。微软执行副总裁Charles Lamanna表示,客户"可以选择如何管理成本",包括设置每名员工的使用上限,以及将Anthropic模型替换为OpenAI或微软自身的替代方案。
留给投资者的问题是,成本控制是否会削弱当初支撑企业AI支出的生产力提升。微软股票目前的远期市盈率为33倍,AI相关收入增长是多头论点的重要支柱。如果代币限流拖慢采用速度,那么当前估值所蕴含的收入预期可能过于乐观。就目前而言,首席财务官们占据了上风。
本文仅供参考,不构成投资建议。