UBS調査、企業の60%がAI支出を抑制—トークンコスト高騰で安価なモデルへシフト

UBSの調査によると、エージェントやコーディングツールによるトークン消費がCFO（最高財務責任者）の監視対象にまで拡大し、中国のオープンソース代替モデルを含むより安価なモデルへの移行を迫られている結果、約60%の企業がAI支出に規制を課している。

「これは小さなスピードバンプではなく、大きなものだ」と、DatabricksのCEOアリ・ゴドシ氏は、この再調整について述べている。

各層の価格差は顕著だ。AnthropicのHaiku 4.5は出力トークン100万個あたり5ドルであるのに対し、最上位のFable/Mythos 5は50ドルと、その差は10倍にも及び、モデルルーティング（振り分け）が経済的に理にかなったものとなっている。報告書によると、ある企業では、1人のユーザーがAWS Bedrockで月間3万5000ドルのAIコストを積み上げたケースがあったという。別の企業では、トークンバジェットを使い果たした後、社内のAIツールを5つから2つに削減した。

このシフトは、AnthropicやOpenAIといったプレミアムAIプロバイダーの収益成長を脅かす一方、より安価な代替手段に門戸を開いている。AlibabaのQwen、DeepSeek、MiniMax、ZhipuのGLMといった中国のオープンソースモデルが、企業の調達リストに登場し始めている。報告書によると、ある大手グローバル銀行は、AnthropicのClaudeの利用とバランスを取るために、Qwenをローカルに導入している。

モデルルーティングがコスト曲線を再形成

最も重要な技術的対応はモデルルーティング、すなわち単純なタスクは安価なモデルに割り当て、複雑な推論には高価なモデルを温存する手法だ。Palantir Technologiesは約1カ月前にAIP Evolveでこのアプローチを商用化し、あるケースでは顧客のトークンコストを97%削減した。この製品は、発売から3週間以内に90%の採用率を達成したと報告書は述べている。

Microsoftがリリースした350億パラメータのシステム「MAI "Thinking" モデル」も、この中間領域を狙ったものだ。推論タスクには十分な性能を持ちながら、フロンティアモデルよりは安価である。この戦略は、より低価格帯で「十分に優れた」AIを目指す、より広範な業界の動きを反映している。

コスト圧力は、中国のオープンソースモデルの採用を加速させている。AWS Bedrockは現在、MiniMax、MoonshotのKimi、Qwen、DeepSeek、GLMをモデルカタログに掲載している。MicrosoftはAzure AI Foundryを通じてDeepSeekを提供している。これらのモデルは通常、無料または低コストであるため、開発者にとって直接的な収益は限定的だが、パートナーシップの機会を生み出している — BMWとAlibabaは最近、自動車向けアプリケーションでQwenを中心に協業した。オープンソースモデルのローカルデプロイは、外部でホストされている中国製AIの利用に伴う規制リスクも回避できるため、銀行などの規制産業にとって実行可能な選択肢となっている。

クラウドとソフトウェアプロバイダーは不均等な圧力に直面

クラウドプラットフォームは、支出シフトの影響を比較的受けにくい。AWS、Azure、Google Cloudはマルチモデルマーケットプレイスを運営しているため、顧客がプレミアムモデルから安価なモデルに切り替えても、API収益の成長は鈍化する可能性があるものの、コンピュートの消費自体は継続する。「企業がコスト管理を強化すればするほど、モデルの選定、デプロイ、課金を単一のクラウドプラットフォームに集中させる可能性が高くなる」とUBSのアナリストは分析している。

ハードウェア需要も依然として堅調だ。NvidiaのGB200およびGB300チップは、ようやく量産出荷が始まったばかりであり、マルチモーダルワークロード（音声、動画、物理AI）は引き続きコンピュートの範囲を拡大し続けている。投資家にとっての論点は、モデル企業間の価格圧縮が、最終的にクラウドGPUの価格決定力を抑制するかどうかだ。

最大手のSaaSプラットフォームは、最も複雑な立場に直面している。Salesforce、ServiceNow、Workdayは、シート単位から消費ベースの価格設定への移行を推進しているが、まさにそのタイミングで顧客がコストに敏感になっている。このタイミングのミスマッチは、彼らのAIマネタイズの取り組みを鈍化させる可能性がある。しかし、ソフトウェア企業にはAIコスト最適化機能としての活路も開けている。PalantirのAIP Evolveはその最も明確な例だが、モデルに依存しないルーティングレイヤーとして機能できるプラットフォームには、構造的な優位性が存在する。

UBS Evidence Labが約130社を対象に調査したところ、AIエージェントを本番環境で大規模に導入している企業はわずか8%だった。さらに37%が限定的な本番環境で使用しており、29%がパイロット段階、26%はエージェントを導入せずにCopilotやコーディングツールのみを使用している。自律型エージェントによるトークン消費の大部分はまだ始まっていない。AI法務アシスタントのHarveyでは、トークン消費量が1月の1兆個から5月には12兆〜13兆個に増加しており、最適化と拡大が両立可能であることを示している。

現在の支出規制は、2022年から2024年にかけてのパンデミック後のクラウド予算削減とは根本的に異なる。あれは成熟した利用を削減するものだった。今回は、初期段階の技術普及期におけるコストガバナンスである。その結果、AI需要が消え去るわけではなく、勝者の再編成が起こる。すなわち、プレミアムモデルプロバイダーは収益成長の鈍化に直面し、コスト最適化プラットフォームが恩恵を受け、クラウドプロバイダーはマルチモデルワークロードを収集し、中国のオープンソースモデルがグローバルなエンタープライズインフラに足場を築くことになる。

本記事は情報提供のみを目的としたものであり、投資助言を構成するものではありません。