Basetenが150億ドル調達、安価なオープンソースAIモデルに賭ける

Basetenの150億ドル調達は、企業のAI支出が高価なクローズドモデルから安価なオープンソース代替モデルへとシフトしていることを示唆している。

オープンソースモデル向けの推論インフラを構築するAIスタートアップBasetenは、最大130億ドルの評価額で150億ドルの資金調達ラウンドを最終調整中である。これは、企業がAI支出を高価なクローズドモデルからより安価な代替モデルにシフトするという最新の賭けである。

「オープンソースモデルは非常に、非常に優れたものになりつつある」とBasetenの共同創業者兼CEOであるTuhin Srivastava氏は述べた。「そしてオープンソースが向上するにつれて、我々もそれとともに成長している。」

今回のラウンドは二層構造を採用しており、一部の投資家は110億ドルの評価額で、他の投資家は130億ドルの評価額で参加していると、同社は述べている。Altimeter Capital、Conviction、Spark Capital、Sands Capital、Wellington Managementがこの投資を共同リードしている。WellingtonにとってはAI推論への初進出となる。Basetenのソフトウェア層は、20のクラウドプロバイダーから調達したコンピューティング容量の上位に位置し、顧客にハードウェアを管理することなく、オープンソースモデルの実行、最適化、トレーニングを行うためのインフラを提供する。

この賭けは、より広範な市場シフトを反映している。オープンソースモデルとクローズドソースモデルの品質ギャップは、2023年の2年から、現在では主要なエンジニアリングベンチマークにおいてわずか数週間にまで縮小したと、独立したテストが示している。DeepSeek-V4は、1.6兆パラメータのオープンモデルで、出力トークン100万個あたり約87セントのコストがかかる。これはOpenAIやAnthropicのフロンティア価格の約30分の1である。企業がAI支出の一部でもオープンソース代替モデルに振り向ければ、2000億ドルを超えるデータセンター建設を支える収益予想は深刻な圧力に直面する可能性がある。

推論層がビジネスに

Basetenは、AIモデルがクエリに応答するためにコンピューティング能力を使用するプロセスである推論ブームを活用する、成長を続けるスタートアップのエコシステムの一部である。推論専用に設計されたチップを開発したCerebrasは5月に上場し、現在約500億ドルの時価総額を誇る。Fireworks AIは10月に40億ドルの評価額で資金を調達し、自律型コーディングエージェントを構築するスタートアップFactoryは4月に15億ドルの評価額に達した。

その経済性が採用を促進している。あるBasetenの顧客はSrivastava氏に対し、クローズドソースモデルに必要なコストの30%で特定のタスクを実行したと語った。Basetenの顧客のほとんどは、オープンモデルとクローズドモデルを混合して使用しており、絶対的な最高のパフォーマンスを必要とするタスクにのみフロンティアシステムを活用し、日常的なワークロードはより安価な代替モデルに振り向けている。

「オープンソースモデルは常にフロンティアモデルより数か月遅れていますが、多くのユースケースに対応できる一方で、絶対的に最高のもののためにトークン使用量の一部を節約することができます」とWellington Managementの投資家であるOz Nur氏は述べた。

中国のオープンソース攻勢

現在、最も人気のあるオープンソースモデルは中国の研究所から提供されている。DeepSeekのV4シリーズとZ.aiのGLM-5.2は、エンジニアリングタスクにおいて米国の主要モデルに匹敵またはそれを上回るベンチマークスコアを記録している。GLM-5.2はTerminal-Bench 2.1で81.0を記録し、数週間前にリリースされた以前のバージョンの62から上昇した。100万トークンのコンテキストウィンドウを持ち、トークンあたりのコストは米国の主要クローズドモデルの約6分の1である。

米国企業は追いつこうと奮闘している。Nvidiaは最近、オープンソースモデルファミリーであるNemotronを発表し、MetaはLlamaシリーズの開発を継続している。しかし中国の研究所はより速いペースで反復開発を行っている。GLMは4か月でバージョン5.0から5.2に移行し、各リリースは国産シリコン上でトレーニングされている。

投資家の計算

投資家にとって、計算は単純明快である。GPT-4クラスの出力コストは、2022年末のトークン100万個あたり約20ドルから、現在は約40セントにまで低下した。これは約1000分の1の減少である。このデフレは今年、メモリ不足により一時停止したが、新たなファブ能力の稼働によりこの傾向が再開する可能性がある。一方、NvidiaのDGX Sparkは、128ギガバイトの統合メモリを搭載した4700ドルのデスクトップマシンで、最大2000億パラメータのモデルをローカルで実行できるようになった。

フロンティアグレードのオープンモデルが手頃な価格のローカルハードウェア上で実行可能になれば、データセンターGPUの5年減価償却スケジュールを正当化する集中型推論需要は、予想よりも鈍化する可能性がある。Michael Burry氏は、2028年までに業界全体で約1760億ドルの過小評価された減価償却があると指摘しており、2026年に計画されている米国のデータセンタープロジェクトの約半数はすでに遅延またはキャンセルに直面している。

Basetenの顧客には、Cursor、Mercor、OpenEvidenceが含まれる。The Informationが先にこの資金調達について報じている。

本記事は情報提供のみを目的としており、投資助言を構成するものではない。