Une expérience interne d'Anthropic au cours de laquelle des agents d'IA ont négocié de manière autonome des transactions réelles a révélé que les modèles les plus performants obtiennent de meilleurs prix, sans que les utilisateurs des modèles moins puissants ne s'en aperçoivent.
La récente expérience « Project Deal » d'Anthropic, où des agents d'IA Claude ont échangé de manière autonome plus de 4 000 $ de marchandises réelles pour des employés, a offert un aperçu frappant du commerce piloté par l'IA, contribuant directement à une baisse de 4,5 % du cours de l'action eBay. Les conclusions de la start-up d'IA, publiées discrètement un vendredi, ont envoyé un signal clair aux places de marché axées sur l'utilisateur concernant le potentiel de rupture de cette technologie.
« Les cadres politiques et juridiques entourant les modèles d'IA qui effectuent des transactions en notre nom n'existent tout simplement pas encore », ont écrit les chercheurs d'Anthropic, soulignant les questions urgentes soulevées par les résultats de l'expérience sur l'équité du marché et l'inégalité invisible.
L'expérience a montré que les agents utilisant le modèle Claude Opus, plus puissant, ont obtenu des prix en moyenne supérieurs de 2,68 $ pour les vendeurs et inférieurs de 2,45 $ pour les acheteurs par rapport au modèle Haiku, plus petit, alors que les utilisateurs des deux modèles ont rapporté des niveaux de satisfaction presque identiques.
Ces résultats signalent une perturbation potentielle pour les places de marché comme eBay, suggérant un avenir où la qualité de l'agent d'IA d'un utilisateur, et non ses propres compétences de négociation, déterminera les résultats économiques, une réalité pour laquelle les marchés et les régulateurs ne semblent pas préparés.
La puissance du modèle fait discrètement basculer le marché
L'expérience d'une semaine, menée en décembre 2025, a impliqué 69 employés d'Anthropic à San Francisco, chacun disposant d'un budget de 100 $. Après un entretien initial avec Claude pour déterminer leurs préférences d'achat, de vente et de négociation, les agents ont été lancés sur quatre places de marché Slack parallèles. Dans deux des sessions, les participants avaient une chance sur deux de se voir attribuer le modèle Claude Haiku 4.5, moins puissant, au lieu du modèle de pointe Claude Opus 4.5.
L'écart de performance n'était pas négligeable. Sur 161 articles, un vendeur Opus a empoché 2,68 $ de plus en moyenne, tandis qu'un acheteur Opus a payé 2,45 $ de moins. Dans un cas précis, un agent Opus a vendu un vélo pliant cassé pour 65 $, alors qu'un agent Haiku gérant exactement le même article pour le même vendeur n'a réussi à obtenir que 38 $. Malgré ces différences monétaires claires, les participants utilisant des agents Haiku ont évalué l'équité de leurs transactions à 4,06 sur 7, un résultat statistiquement identique à la note de 4,05 des utilisateurs d'Opus.
Une implication inconfortable pour le commerce électronique
Anthropic qualifie cet écart de perception d'« implication inconfortable ». Lorsque des agents de forces différentes s'affrontent sur un marché, les utilisateurs peuvent se retrouver avec des résultats objectivement moins bons sans jamais s'en rendre compte. Cela crée une forme d'inégalité invisible que les structures de marché actuelles ne sont pas conçues pour traiter. La nouvelle a immédiatement exercé une pression sur les actions du commerce électronique, les actions d'eBay chutant d'environ 4,5 % le jour de la publication du rapport.
L'expérience suggère que le commerce médiatisé par des agents n'est pas un futur lointain, 46 % des participants déclarant qu'ils seraient prêts à payer pour un tel service. Anthropic, qui positionne Claude pour les transactions grand public, a signalé plusieurs risques, notamment de nouvelles voies de manipulation comme l'injection de prompts et le fait que les cadres juridiques pour les transactions pilotées par l'IA sont inexistants. La question centrale à laquelle l'industrie est désormais confrontée est de savoir si les places de marché seront tenues de divulguer la capacité des agents négociant au nom des utilisateurs, un défi réglementaire qui devrait définir la prochaine phase du commerce électronique.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.