AIの幻覚(ハルシネーション)に対する1億ドルの答え——それは元マイクロソフト研究員2名によってもたらされた。
AIの幻覚(ハルシネーション)に対する1億ドルの答え——それは元マイクロソフト研究員2名によってもたらされた。

AIの幻覚(ハルシネーション)に対する1億ドルの答え——それは元マイクロソフト研究員2名によってもたらされた。
元マイクロソフト研究員2名が創業したAIスタートアップScaled Cognitionは、エンタープライズAIアプリケーションにおける幻覚(ハルシネーション)を排除するために設計されたモデルアーキテクチャを商用化すべく、シリーズAで1億ドルを調達した。
「これらのフロンティアモデルは、まるで統合失調症の天才のようなものだ。驚くべき回答を生成するかと思えば、同じ質問をしても全く異なる、しかも正しくないかもしれない答えを返す」とScaled Cognitionの最高経営責任者ダン・ロス氏は語った。
同社のAgentic Pretrained Transformer(APT)は、従来のトークンストリームに加えて、プログラムやシステムクエリなどの構造化オブジェクトを予測する。これは、言語的な妥当性を最適化しながらも事実の正確性を検証しない大規模言語モデル(LLM)とは一線を画すアプローチである。この手法は、可能なクエリの範囲が限られる狭いエンタープライズ領域で最も効果を発揮するとロス氏は述べている。
評価額7億5000万ドル、そしてシリコンバレーで最も著名なAI投資家の一角であるKhosla Venturesからの支援は、信頼性重視のAIインフラへの需要の高まりを示している。クラウドベースのカスタマーエクスペリエンスプラットフォームを提供するGenesysは、すでに同社のGenesys Cloudプラットフォーム内で仮想エージェント機能としてAPTを採用している。
OpenAI、Anthropic、Googleの大規模言語モデルは、MMLUやHumanEvalなどのベンチマークで90%以上のスコアを記録し、一般的な知識タスクにおいて高い能力を示している。しかし、これらのモデルは自信に満ちた口調でありながら事実誤認を含む回答を生成することがあり、規制産業においては許容されない欠陥となる。処方箋番号の1桁の誤りが法的責任を引き起こす可能性があるからだ。「たった1つのエラーが破滅的な結果を招きかねない」とロス氏は述べ、自動化されたヘルスケアエージェントが「処方箋番号の一桁すら幻覚で間違える余裕はない」と指摘する。
Khosla Venturesの創業パートナーであるヴィノッド・コスラ氏によれば、Scaled Cognitionのアーキテクチャは、信頼性の必要性に応じてクエリの異なる部分を最適なシステムにルーティングすることでこの問題に対処している。「真の信頼性が求められ、幻覚の影響を受けてはならないシステムの部分には、独立したモデルが使用される」と同氏は述べた。
AIが生成したアウトプットを大規模に検証するという課題は、エンタープライズ導入における主要な障壁である。人間が数行のコードを簡単にチェックすることはできても、数十万行のAI生成コードを検証することは事実上不可能だと、カリフォルニア大学バークレー校のコンピュータサイエンス教授でDatabricksの共同創業者でもあるイオン・ストイカ氏は指摘する。「そのため、プログラムによる信頼性の確保は、エンタープライズシステムにとって絶対的な必要条件となる」と同氏は述べた。
Scaled Cognitionは、調達した資金を研究チームの拡大とエンタープライズ導入の加速に充てる計画だ。カリフォルニア州マウンテンビューに拠点を置く同スタートアップは、ロス氏と、自然言語処理研究者でUCバークレーのAI教授でもあるダン・クライン氏によって創業された。両氏は以前、スタートアップのSemantic Machinesを2018年にマイクロソフトに売却している。同社はカスタマーエクスペリエンスを最初の市場としてターゲットにしており、AIを搭載したエージェントが毎日数百万ものインタラクションを処理し、精度が顧客維持率や規制遵守に直接影響を与える分野である。GenesysによるAPTの採用は、この技術の商業的有効性を示す初期の証明となっている。
投資家にとって、Scaled Cognitionへの賭けはより広範なテーゼを反映している。すなわち、エンタープライズが生成AIの実験段階を超えて進むにつれ、モデルのアウトプットを信頼できるかどうかが競争優位性となるというものだ。信頼性問題を解決した企業は、エンタープライズAI市場で不均衡なシェアを獲得できる可能性がある。ガートナーは、この市場が2027年までに3000億ドルの支出に達すると予測している。Scaled Cognitionの狭領域アプローチは、汎用モデルと比較して総アドレス可能市場(TAM)を制限する可能性があるが、企業が証明可能な正確なアウトプットに対して支払うプレミアムが、その制約を相殺する可能性もある。
本記事は情報提供のみを目的としており、投資助言を構成するものではない。