AI ajanlarının otonom olarak gerçek anlaşmalar üzerinde pazarlık yaptığı bir Anthropic dahili deneyi, daha güçlü modellerin daha iyi fiyatlar aldığını ve zayıf modellere sahip kullanıcıların bu farkı fark etmediğini ortaya koydu.
Anthropic’in Claude yapay zeka ajanlarının çalışanlar için otonom olarak 4.000 dolardan fazla gerçek mal ticareti yaptığı son “Project Deal” deneyi, yapay zeka odaklı ticaretin sert bir ön izlemesini sunarak eBay'in hisse fiyatında %4,5'lik bir düşüşe doğrudan katkıda bulundu. Yapay zeka girişiminden Cuma günü sessizce paylaşılan bulgular, kullanıcı odaklı pazar yerlerine teknolojinin yıkıcı potansiyeli hakkında net bir sinyal gönderdi.
Anthropic araştırmacıları, pazar adaleti ve görünmez eşitsizlik üzerine yapılan deneyin bulgularının ortaya çıkardığı acil sorulara dikkat çekerek, "Adımıza işlem yapan yapay zeka modellerini çevreleyen politika ve yasal çerçeveler henüz mevcut değil," diye yazdı.
Deney, daha güçlü olan Claude Opus modelini kullanan ajanların, daha küçük olan Haiku modeline kıyasla satıcılar için ortalama 2,68 dolar daha yüksek ve alıcılar için 2,45 dolar daha düşük fiyatlar sağladığını, buna rağmen her iki modelin kullanıcılarının da neredeyse aynı memnuniyet seviyelerini bildirdiğini gösterdi.
Sonuçlar, eBay gibi kullanıcı odaklı pazar yerleri için potansiyel bir bozulmaya işaret ediyor; bu da ekonomik sonuçları kullanıcının kendi pazarlık becerisinin değil, yapay zeka ajanının kalitesinin belirlediği bir geleceğe işaret ediyor; piyasaların ve düzenleyicilerin bu gerçeğe henüz hazır olmadığı görülüyor.
Model Gücü Piyasayı Sessizce Etkiliyor
Aralık 2025'te San Francisco'daki 69 Anthropic çalışanıyla gerçekleştirilen bir haftalık deneyde her çalışana 100 dolarlık bir bütçe verildi. Alım, satım ve pazarlık tercihlerini belirlemek için Claude ile yapılan ilk görüşmenin ardından ajanlar dört paralel Slack pazar yerine bırakıldı. Denemelerin ikisinde katılımcıların en gelişmiş Claude Opus 4.5 yerine daha az güçlü olan Claude Haiku 4.5 modeline atanma şansı yarı yarıyaydı.
Performans farkı önemsiz değildi. 161 ürün genelinde, bir Opus satıcısı ortalama 2,68 dolar daha fazla kazanırken, bir Opus alıcısı 2,45 dolar daha az ödedi. Belirli bir örnekte, bir Opus ajanı bozuk bir katlanır bisikleti 65 dolara satarken, aynı satıcı için aynı ürünü satan bir Haiku ajanı sadece 38 dolar alabildi. Bu bariz parasal farklara rağmen, Haiku ajanlarına sahip katılımcılar işlemlerinin adaletini 7 üzerinden 4,06 olarak puanladı; bu, Opus kullanıcılarının 4,05'lik puanıyla istatistiksel olarak aynıydı.
E-Ticaret İçin Rahatsız Edici Bir Çıkarım
Anthropic bu algı farkını “rahatsız edici bir çıkarım” olarak nitelendiriyor. Bir pazar yerinde farklı güçteki ajanlar rekabet ettiğinde, kullanıcılar farkına bile varmadan nesnel olarak daha kötü sonuçlar elde edebilirler. Bu, mevcut piyasa yapılarının ele almak üzere tasarlanmadığı bir görünmez eşitsizlik biçimi yaratıyor. Haber, e-ticaret hisseleri üzerinde hemen baskı oluşturdu ve raporun yayınlandığı gün eBay hisseleri yaklaşık %4,5 düştü.
Deney, katılımcıların yüzde 46'sının böyle bir hizmet için ödeme yapacağını söylemesiyle ajan aracılı ticaretin uzak bir gelecek olmadığını gösteriyor. Claude'u tüketici işlemleri için konumlandıran Anthropic, 'prompt injection' gibi yeni manipülasyon yolları ve yapay zeka odaklı işlemler için yasal çerçevelerin mevcut olmaması dahil olmak üzere çeşitli risklere işaret etti. Sektörün şu an karşı karşıya olduğu temel soru, pazar yerlerinin kullanıcılar adına pazarlık yapan ajanların yeteneklerini açıklamasının zorunlu olup olmayacağıdır; bu, e-ticaretin bir sonraki aşamasını tanımlayacak bir düzenleme zorluğudur.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.