Un experimento interno de Anthropic en el que agentes de IA negociaron de forma autónoma acuerdos reales reveló que los modelos más potentes aseguran mejores precios, y los usuarios con modelos más débiles no notan la diferencia.
El reciente experimento "Project Deal" de Anthropic, en el que agentes de IA de Claude intercambiaron de forma autónoma más de 4.000 dólares en bienes reales para empleados, ha ofrecido un avance contundente del comercio impulsado por IA, contribuyendo directamente a una caída del 4,5% en el precio de las acciones de eBay. Los hallazgos de la startup de IA, que se publicaron discretamente un viernes, enviaron una señal clara a los mercados impulsados por usuarios sobre el potencial disruptivo de la tecnología.
"Los marcos políticos y legales en torno a los modelos de IA que realizan transacciones en nuestro nombre simplemente no existen todavía", escribieron los investigadores de Anthropic, destacando las urgentes preguntas planteadas por los hallazgos del experimento sobre la equidad del mercado y la desigualdad invisible.
El experimento mostró que los agentes que utilizaban el modelo más potente, Claude Opus, aseguraron precios 2,68 dólares más altos para los vendedores y 2,45 dólares más bajos para los compradores en promedio en comparación con el modelo más pequeño, Haiku; sin embargo, los usuarios de ambos modelos reportaron niveles de satisfacción casi idénticos.
Los resultados señalan una posible interrupción para mercados impulsados por usuarios como eBay, sugiriendo un futuro en el que la calidad del agente de IA de un usuario, y no su propia habilidad de negociación, determine los resultados económicos, una realidad para la cual los mercados y los reguladores no parecen estar preparados.
La potencia del modelo inclina discretamente el mercado
El experimento de una semana, realizado en diciembre de 2025, involucró a 69 empleados de Anthropic en San Francisco, cada uno con un presupuesto de 100 dólares. Después de una entrevista inicial con Claude para determinar sus preferencias de compra, venta y negociación, los agentes fueron liberados en cuatro mercados paralelos de Slack. En dos de las ejecuciones, los participantes tenían un cincuenta por ciento de posibilidades de que se les asignara el modelo menos potente, Claude Haiku 4.5, en lugar del avanzado Claude Opus 4.5.
La brecha de rendimiento no fue trivial. En 161 artículos, un vendedor con Opus obtuvo 2,68 dólares más en promedio, mientras que un comprador con Opus pagó 2,45 dólares menos. En un caso específico, un agente Opus vendió una bicicleta plegable rota por 65 dólares, mientras que un agente Haiku que gestionaba exactamente el mismo artículo para el mismo vendedor solo logró obtener 38 dólares. A pesar de estas claras diferencias monetarias, los participantes con agentes Haiku calificaron la equidad de sus acuerdos en 4,06 sobre 7, estadísticamente idéntico a la calificación de 4,05 de los usuarios de Opus.
Una implicación incómoda para el comercio electrónico
Anthropic califica la brecha de percepción como una "implicación incómoda". Cuando agentes de diferentes potencias compiten en un mercado, los usuarios pueden terminar con resultados objetivamente peores sin siquiera darse cuenta. Esto crea una forma de desigualdad invisible que las estructuras de mercado actuales no están diseñadas para abordar. La noticia presionó de inmediato a las acciones de comercio electrónico, y las acciones de eBay cayeron aproximadamente un 4,5% el día en que se publicó el informe.
El experimento sugiere que el comercio mediado por agentes no es un futuro lejano, ya que el 46 por ciento de los participantes dijo que pagaría por un servicio de este tipo. Anthropic, que ha estado posicionando a Claude para transacciones de consumo, señaló varios riesgos, incluyendo nuevas vías de manipulación como la inyección de prompts y el hecho de que los marcos legales para las transacciones impulsadas por IA son inexistentes. La pregunta central que enfrenta ahora la industria es si se requerirá que los mercados revelen la capacidad de los agentes que negocian en nombre de los usuarios, un desafío regulatorio que probablemente definirá la próxima fase del comercio electrónico.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.