Anthropic’in Claude Yapay Zekası, Bildirilen %67 Performans Düşüşü Nedeniyle Kullanıcı Tepkisiyle Karşı Karşıya

Anthropic, amiral gemisi Claude Opus 4.6 modelinin sessizce "zayıflatıldığı" (nerfed) veya daha az yetenekli hale getirildiği iddiaları nedeniyle kurumsal kullanıcılardan önemli bir tepkiyle karşı karşıya. Yapılan bir analiz, modelin karmaşık kodlama görevleri için akıl yürütme derinliğinde %67'lik bir azalma olduğunu gösteriyor. Bu tartışma, özellikle OpenAI'nın kurumsal teklifleriyle rekabet ederken ve bildirildiğine göre bir halka arz (IPO) yolunda ilerlerken, 380 milyar dolarlık girişime olan güveni sarsma tehdidi taşıyor.

AMD'nin yapay zeka kıdemli direktörü Stella Laurenzo, yaygın olarak paylaşılan bir GitHub analizinde, "Düşünce sığlaştığında, model en düşük maliyetli eylemi gerçekleştirme eğiliminde oluyor," diye yazdı. "Okumadan değişiklik yapmak, bitmeden durmak, hatalarının sorumluluğundan kaçmak ve en doğru çözümü değil en basit çözümü seçmek."

GitHub, Reddit ve X platformlarına yayılan kullanıcı şikayetlerinin temelinde, Claude'un başlangıçta övüldüğü karmaşık, çok adımlı iş akışları için daha az güvenilir hale gelmesi yatıyor. Laurenzo'nun 6.800'den fazla Claude Code oturumu üzerinde yaptığı analiz, Şubat sonundan Mart başına kadar modelin "düzenleme başına okuma" miktarının (kod yazmadan önce ne kadar bağlamı dikkate aldığının bir göstergesi) 6,6'dan 2,0'a düştüğünü ortaya koydu. Yanıt olarak Anthropic'in Claude Code başkanı Boris Cherny, şirketin modeli gizlice bozmadığını, ancak çoğu kullanıcı için zeka, gecikme süresi ve maliyeti dengelemek amacıyla varsayılan "çaba" seviyesini "orta" olarak değiştirdiğini belirtti.

Bu tartışma, müşterilerin sunulan zeka kalitesi konusunda garanti almaksızın standart görünen bir yapay zeka işlem birimi için ödeme yaptığı "token ekonomisinin" şeffaf olmayan doğasını vurguluyor. Token fiyatları üç yılda yaklaşık 300 kat düşerken, kurumsal yapay zeka bütçelerini kontrol etmek zorlaşıyor. Mavvrik ve Benchmarkit tarafından yapılan bir anket, işletmelerin %84'ünün yapay zeka maliyetlerinin brüt marjları beklenenden daha fazla aşındırdığını bildirdiğini; yalnızca %15'inin bütçe farkını %10 içinde kontrol edebildiğini gösterdi. Sorun, önbellekleme gibi teknik faktörlerle daha da karmaşıklaşıyor; bir analiz, Claude Code'un önbellekleme davranışındaki bir değişikliğin girdi maliyetlerini 5,7 kat artırabileceğini gösterdi.

"Küçülme Enflasyonu" Sorunu

Kullanıcı isyanının merkezinde, daha az yetenekli bir ürün için aynı fiyatı ödedikleri hissi yatıyor; bu durum bazıları tarafından "yapay zeka küçülme enflasyonu" (AI shrinkflation) olarak adlandırılıyor. Sorun, geliştirici Om Patel'in X'teki viral bir paylaşımının algılanan düşüşü %67'lik bir yetenek kaybı olarak özetlemesinin ardından ivme kazandı ve Laurenzo'nun GitHub analizindeki bulguları yineledi.

Anthropic, algılanan değişiklikleri gizli bir seviye düşürmeye değil, ürün ve arayüz seçimlerine bağlayarak geri adım atmadı. Cherny, 9 Şubat'ta Opus 4.6'nın varsayılan olarak "uyarlanabilir düşünmeyi" etkinleştirdiğini ve 3 Mart'ta varsayılan çaba seviyesinin "orta" olarak ayarlandığını belirtti. Claude Code terminali kullanıcıları çabayı manuel olarak "yüksek" seviyesine getirebilse de, diğer platformlardaki Pro ve Kurumsal kullanıcılar bunu yapamıyor. Tepkilere yanıt olarak Cherny, şirketin Teams ve Kurumsal kullanıcılarını varsayılan olarak "yüksek çaba" moduna almayı test edeceğini söyledi.

Bir Güven ve Hesaplama Sorusu

Tartışma, Anthropic'in yoğun talep gördüğü, bu durumun yoğun saatlerde daha sıkı kullanım limitlerine yol açtığı ve şirketin bir hesaplama (compute) sıkıntısıyla karşı karşıya olabileceği spekülasyonlarını körüklediği bir dönemde gerçekleşiyor. OpenAI'nın gelir sorumlusu, bildirilen bir dahili notta Anthropic'in yeterli hesaplama kapasitesi sağlamayarak "stratejik bir hata" yaptığını iddia etti. Anthropic, talebi yönetmek için modelleri zayıflattığını reddetti.

Durum, kendisini rakiplerinden daha şeffaf ve kullanıcı çıkarlarıyla uyumlu olarak markalayan bir şirket için kritik bir güven boşluğu yaratıyor. Anthropic, OpenAI'nın Codex gibi teklifleriyle rekabet ederken ve potansiyel bir halka arza hazırlanırken, maliyet dengeleme nedenleriyle de olsa model kalitesini sessizce düşüreceği algısı, büyümesinin temelini oluşturan kurumsal geliştiriciler nezdindeki konumuna zarar verebilir. Şirketin önündeki zorluk, artık bir tokenın sabit fiyatı ile içerdiği "zekanın" değişken değerini uzlaştırmaktır.

Bu makale sadece bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.