主な要点
- Physical Intelligenceの新しいπ0.7モデルは「構成的汎化」を示しており、ロボットが特定の訓練なしでタスクを実行することを可能にします。これは汎用ロボットに向けた重要な一歩です。
- 同社は新たな資金調達ラウンドを協議中であり、商用化のスケジュールがないにもかかわらず、評価額がほぼ倍増の110億ドルに達する可能性があります。
- このAIモデルは、直接的な学習データがほとんどなかったエアフライヤーの使用方法をロボットに指導することに成功し、研究者自身を驚かせました。
主な要点

ロボット工学のスタートアップであるPhysical Intelligenceは、新しいAIモデルが、これまで訓練を受けていないタスクをロボットに実行させるという研究の飛躍的進歩を受け、以前の評価額のほぼ2倍にあたる約110億ドルの企業価値で新たな資金調達ラウンドを協議中です。設立2年の同社による新モデル「π0.7」は、同社が「構成的汎化(compositional generalization)」と呼ぶ能力を示しています。これは、異なる文脈で学んだスキルを組み合わせて新しい問題を解決することをロボットに可能にする、長年求められてきた能力であり、汎用ロボットの頭脳に向けた重要な一歩となります。
Physical Intelligenceの共同創設者でUCバークレー校の教授であるセルゲイ・レヴィン氏は、「データを収集したことだけを正確に行う段階から、実際に物事を新しい方法で再構成する段階へと閾値を越えると、能力はデータの量に対して線形以上に向上します」と述べています。同氏はこのスケーリング特性が言語や視覚などの他のAI領域でも見られており、ロボット工学分野も同様の変曲点にある可能性を示唆しました。
核となる主張は、断片的な情報を統合するモデルの能力に集中しています。主要なデモンストレーションでは、訓練データにその機器に関する無関係な短いエピソードが2つしか含まれていなかったにもかかわらず、π0.7はロボットがエアフライヤーを使ってサツマイモを調理することを可能にしました。このモデルは、コーヒーを淹れる、洗濯物を畳むといった複雑な雑用において、特定の単一タスクに特化したモデルのパフォーマンスに匹敵しました。Physical Intelligenceはこれまでに10億ドル以上を調達しており、前回の評価額は56億ドルでした。
この技術的進歩は汎用ロボットの商用化を加速させ、製造業から物流業に至るまでの産業を破壊する可能性があります。投資家にとって、これはAIおよびロボット工学セクターにおける大きな進展であり、さらなる投資やM&A活動を促進する可能性があります。しかし、同社は商用化のスケジュールを提示することを断固として拒否しています。こうした姿勢は投資家を思いとどまらせておらず、その理由の一部には、FigmaやNotionといった企業を支援した、高く評価されている元エンジェル投資家の共同創設者ラッキー・グルーム氏の経歴があります。
π0.7による突破口は、特定のタスクごとに膨大なデータセットを収集することに依存する(一種の丸暗記である)標準的なロボット訓練のパラダイムからの脱却を意味します。構成的汎化を達成することで、モデルは以前の、一見無関係な知識を組み合わせることで、新しいタスクの実行方法を推論できるようになります。レヴィン氏は、この驚くべき結果を、研究者が初めてGPT-2言語モデルがアンデス山脈のユニコーンについての物語(明示的に教えられたことのない奇妙な組み合わせ)を生成したのを見た瞬間に例えました。
Physical Intelligenceの研究員であるアシュウィン・バラクシュナ氏は、「私の経験では、データの中に何が入っているかを深く理解していれば、モデルが何ができるかをある程度推測できました」と述べています。「驚くことはめったにありませんでした。しかし、ここ数ヶ月は心から驚かされた初めての時期でした」
研究チームは、モデルの現在の限界についても率直です。まだ「トーストを焼いて」といった単一の高度なコマンドから、複雑で多段階のタスクを実行することはできません。しかし、ステップバイステップの口頭指示で指導された場合には優れた能力を発揮します。これは、ロボットが新しい環境に配置され、再訓練を必要とせずに人間の作業員によってオンサイトで教えられる可能性があることを示唆しています。ある実験では、研究者がプロンプトの微調整に30分を費やした後、エアフライヤーのタスクの成功率は5%から95%に急上昇しました。
研究は汎化の「初期の兆候」と慎重な表現で発表されていますが、財務的な影響はより直接的です。Physical Intelligenceの評価額を110億ドル近くとする新ラウンドの協議が報じられたことは、AIの根本的な進歩を示す企業に対する投資家の強い意欲を浮き彫りにしています。この評価額は、製品の展開スケジュールを確約していない企業としては特に注目に値します。
レヴィン氏は、デモンストレーションされたタスクが、バックフリップをするロボットのバイラル動画と比較して「退屈だ」という潜在的な批判に反論しました。同氏は、汎化は綿密に振り付けられたスタントよりもドラマチックには見えないかもしれないが、はるかに有用であり、真のフロンティアを象徴していると主張しました。明確な収益への道筋がないまま、同社が最高級の機関投資家資本を引きつけることができているのは、ロボットの汎化を解決することが「勝者総取り」の賞品であるという信念に基づいています。
実世界への展開時期について尋ねられると、レヴィン氏は推測を避けましたが、進展は「数年前に予想していたよりも速い」と述べました。投資家にとっての賭けは、特定の製品ではなく、Physical Intelligenceが、いつの日か経済全体の膨大なロボットシステムを動かす可能性のある基礎的な「頭脳」を構築しているという点にあるのです。
この記事は情報提供のみを目的としており、投資アドバイスを構成するものではありません。