AIエージェントが実社会の取引を自律的に交渉したAnthropicの内部実験により、強力なモデルほど有利な価格を確保できる一方、性能の低いモデルを使用しているユーザーはその差に気づかないことが明らかになりました。
Anthropicが最近実施した実験「Project Deal」では、Claude AIエージェントが従業員に代わって4,000ドル以上の実商品を自律的に取引しました。これはAI主導の商業がもたらす未来の冷徹なプレビューとなり、eBayの株価を4.5%下落させる直接的な要因となりました。金曜日にひっそりと発表されたこのAIスタートアップによる調査結果は、ユーザー主導のマーケットプレイスに対し、テクノロジーが持つ破壊的な潜在力について明確なシグナルを送りました。
「私たちの代わりに取引を行うAIモデルをめぐる政策的・法的枠組みは、現時点では全く存在しません」とAnthropicの研究者は記しており、市場の公平性と「見えない不平等」に関して実験結果が提起した緊急の課題を強調しています。
実験では、より強力なClaude Opusモデルを使用したエージェントは、小規模なHaikuモデルと比較して、売り手に対しては平均2.68ドル高く、買い手に対しては平均2.45ドル安い価格を確保しました。それにもかかわらず、両モデルのユーザーが報告した満足度はほぼ同一でした。
この結果は、eBayのようなユーザー主導型マーケットプレイスにとって混乱の兆しとなります。経済的な成果を決定するのはユーザー自身の交渉術ではなく、使用するAIエージェントの質であるという未来を示唆しており、市場や規制当局はその現実への備えができていないようです。
モデルの強さが静かに市場を傾ける
2025年12月に実施された1週間の実験には、サンフランシスコのAnthropic従業員69名が参加し、それぞれ100ドルの予算が与えられました。購入、販売、交渉の好みを決定するためのClaudeとの初回インタビューの後、エージェントは4つの並行するSlackマーケットプレイスに投入されました。2回の試行では、参加者が最先端のClaude Opus 4.5ではなく、性能の低いClaude Haiku 4.5モデルを割り当てられる確率は50%でした。
性能の差は無視できないものでした。161の商品にわたり、Opusの売り手は平均2.68ドル多く稼ぎ、Opusの買い手は2.45ドル少なく支払いました。ある具体的な事例では、Opusエージェントが故障した折りたたみ自転車を65ドルで売却した一方、同じ売り手の同じ商品を扱ったHaikuエージェントは38ドルしか得られませんでした。このような明白な金銭的差異があるにもかかわらず、Haikuエージェントを使用した参加者は取引の公平性を7点満点中4.06と評価し、Opusユーザーの4.05という評価と統計的に同等でした。
電子商取引への不穏な示唆
Anthropicはこの認識のギャップを「不穏な示唆」と呼んでいます。能力の異なるエージェントが市場で競合する場合、ユーザーは気づかないうちに客観的に悪い結果を手にすることになります。これは、現在の市場構造では対処できない「見えない不平等」の一形態を生み出します。このニュースを受け、電子商取引関連株は即座に圧力を受け、レポートが発表された日のeBay株は約4.5%下落しました。
参加者の46%がそのようなサービスに料金を支払うと回答しており、エージェントが介在する商業は遠い未来の話ではないことを示唆しています。Claudeを消費者取引向けに位置づけてきたAnthropicは、プロンプトインジェクションのような新しい操作手法や、AI主導の取引に対する法的枠組みの欠如など、いくつかのリスクを指摘しました。現在、業界が直面している中心的な問いは、マーケットプレイスに対し、ユーザーに代わって交渉するエージェントの能力を開示することを義務付けるかどうかであり、この規制上の課題が電子商取引の次の段階を定義することになりそうです。
この記事は情報提供のみを目的としており、投資アドバイスを構成するものではありません。