Một thử nghiệm nội bộ của Anthropic cho thấy các đại lý AI tự động đàm phán các giao dịch thực tế đã tiết lộ rằng các mô hình mạnh hơn đảm bảo mức giá tốt hơn và người dùng có mô hình yếu hơn không nhận thấy sự khác biệt.
Thử nghiệm "Project Deal" gần đây của Anthropic, nơi các đại lý AI Claude tự động giao dịch hơn 4.000 USD hàng hóa thực cho nhân viên, đã mang đến một cái nhìn sơ lược về thương mại do AI thúc đẩy, góp phần trực tiếp vào việc giá cổ phiếu của eBay giảm 4,5%. Những phát hiện từ công ty khởi nghiệp AI này, vốn được công bố lặng lẽ vào thứ Sáu, đã gửi một tín hiệu rõ ràng đến các thị trường do người dùng điều khiển về tiềm năng đột phá của công nghệ.
"Các khung chính sách và pháp lý xung quanh các mô hình AI thực hiện giao dịch thay mặt chúng ta đơn giản là chưa tồn tại", các nhà nghiên cứu của Anthropic viết, nhấn mạnh những câu hỏi cấp bách đặt ra từ những phát hiện của thử nghiệm về sự công bằng của thị trường và sự bất bình đẳng vô hình.
Thử nghiệm cho thấy các đại lý sử dụng mô hình Claude Opus mạnh mẽ hơn đã đảm bảo mức giá cao hơn trung bình 2,68 USD cho người bán và thấp hơn 2,45 USD cho người mua so với mô hình Haiku nhỏ hơn, nhưng người dùng của cả hai mô hình đều báo cáo mức độ hài lòng gần như giống hệt nhau.
Kết quả báo hiệu một sự xáo trộn tiềm tàng cho các thị trường do người dùng điều khiển như eBay, gợi ý về một tương lai nơi chất lượng của đại lý AI của người dùng, chứ không phải kỹ năng đàm phán của chính họ, sẽ quyết định kết quả kinh tế, một thực tế mà các thị trường và cơ quan quản lý dường như chưa sẵn sàng.
Sức mạnh mô hình lặng lẽ làm nghiêng thị trường
Thử nghiệm kéo dài một tuần, được thực hiện vào tháng 12 năm 2025, có sự tham gia của 69 nhân viên Anthropic tại San Francisco, mỗi người được cấp ngân sách 100 USD. Sau cuộc phỏng vấn ban đầu với Claude để xác định sở thích mua, bán và đàm phán của họ, các đại lý đã được thả vào bốn thị trường Slack song song. Trong hai đợt chạy, những người tham gia có 50% cơ hội được chỉ định mô hình Claude Haiku 4.5 kém mạnh mẽ hơn thay vì Claude Opus 4.5 tiên tiến.
Khoảng cách hiệu suất không hề nhỏ. Trên 161 mặt hàng, một người bán dùng Opus đã thu về trung bình thêm 2,68 USD, trong khi một người mua dùng Opus trả ít hơn 2,45 USD. Trong một trường hợp cụ thể, một đại lý Opus đã bán một chiếc xe đạp gấp bị hỏng với giá 65 USD, trong khi một đại lý Haiku xử lý cùng một mặt hàng cho cùng một người bán chỉ thu về 38 USD. Bất chấp những khác biệt rõ rệt về tiền bạc này, những người tham gia có đại lý Haiku đánh giá mức độ công bằng trong các giao dịch của họ là 4,06 trên 7, về mặt thống kê giống hệt với mức đánh giá 4,05 từ người dùng Opus.
Một hệ lụy khó chịu cho thương mại điện tử
Anthropic gọi khoảng cách nhận thức này là một "hệ lụy khó chịu". Khi các đại lý có sức mạnh khác nhau cạnh tranh trong một thị trường, người dùng có thể nhận được kết quả tồi tệ hơn một cách khách quan mà không bao giờ nhận ra. Điều này tạo ra một dạng bất bình đẳng vô hình mà các cấu trúc thị trường hiện tại không được thiết kế để giải quyết. Tin tức này ngay lập tức gây áp lực lên các cổ phiếu thương mại điện tử, với cổ phiếu eBay giảm khoảng 4,5% vào ngày báo cáo được công bố.
Thử nghiệm cho thấy thương mại qua trung gian đại lý không phải là tương lai xa vời, vì 46% người tham gia cho biết họ sẽ trả tiền cho một dịch vụ như vậy. Anthropic, công ty đang định vị Claude cho các giao dịch tiêu dùng, đã gắn cờ một số rủi ro, bao gồm các con đường thao túng mới như tấn công tiêm lệnh (prompt injection) và thực tế là các khung pháp lý cho các giao dịch do AI thúc đẩy vẫn chưa tồn tại. Câu hỏi trọng tâm mà ngành hiện đang đối mặt là liệu các thị trường có bị yêu cầu tiết lộ khả năng của các đại lý đàm phán thay mặt cho người dùng hay không, một thách thức về mặt quy định có khả năng định nghĩa giai đoạn tiếp theo của thương mại điện tử.
Bài viết này chỉ dành cho mục đích thông tin và không cấu thành lời khuyên đầu tư.