Anthropic'in Mythos Yapay Zeka Balonu Söndü: %72'lik İstismar İddiası Gerçek Testlerde %4'e Düştü

Finans ve istihbarat sektörlerinde alarm zillerinin çalmasına neden olan Anthropic'in yeni Claude Mythos yapay zeka modeli, en çarpıcı siber güvenlik iddialarının zayıflatılmış test ortamlarına ve tahmin edilen verilere dayandığının ortaya çıkmasıyla inceleme altında. Bu durum, rapor edilen %72,4'lük tarayıcı istismar oranını daha gerçekçi koşullarda sadece %4,4'e indiriyor.

İngiltere Merkez Bankası Başkanı Andrew Bailey, New York'taki bir etkinlikte modelin lansmanına verilen ilk tepkiyi şu sözlerle özetledi: "Bir sabah uyanıyorsunuz ve Anthropic'in tüm siber risk dünyasını altüst edecek bir yol bulmuş olabileceğini görüyorsunuz."

Anthropic'in tanıtımının merkezinde, Mythos'un Firefox'a karşı %72,4 oranında tam kod yürütme başarısı sağladığı bildirilen bir gösterim yer alıyordu. Ancak şirketin kendi 244 sayfalık teknik dokümantasyonu, testin standart bir tarayıcıyı değil, basitleştirilmiş bir JavaScript kabuğunu hedef aldığını ve önceden yamalanmış iki özel hatanın veri setinden çıkarılması durumunda başarı oranının %4,4'e çakıldığını ortaya koyuyor. Benzer şekilde, "binlerce" sıfır gün (zero-day) güvenlik açığı keşfedildiği iddiası, sadece 198 raporun manuel olarak incelenmesinden yola çıkılarak tahmin edilmiştir.

Saldırgan güvenlik iddiaları abartılı görünse de, modelin yazılım mühendisliği ve otonom davranış konusundaki belgelenmiş performansı işletmeler için daha karmaşık bir zorluk teşkil ediyor. Bu durum, Anthropic'in şirketi 60 milyar doların üzerinde bir değerle halka arz etmeye (IPO) hazırlandığı bir dönemde, pazarlama stratejisi ile teknik gerçeklik arasındaki gerilimi vurguluyor.

Güvenlik Açığı Matematiği Tutmuyor

Mythos'un ağ güvenliği için kıyamet benzeri bir tehdit olduğu anlatısı, bağımsız araştırmacıların ve güvenlik profesyonellerinin şirketin teknik sistem kartını incelemesiyle sarsılmaya başladı. Project Glasswing girişimi için hazırlanan bir pazarlama sayfasından kaynaklanan "binlerce" yüksek öncelikli güvenlik açığı iddiası, araştırma verileriyle desteklenmedi. Anthropic araştırmacıları, model tarafından bulunan açıklardan yalnızca 198'ini manuel olarak doğrulamış ve ardından bu küçük örneklemin %90'lık doğruluk oranını modelin tüm ham çıktısına genelleyerek tahminde bulunmuşlardı.

Daha derinlemesine yapılan analizler, OpenBSD'deki 27 yıllık bir güvenlik açığı gibi çokça reklamı yapılan diğer keşiflerin Mythos'a özgü olmadığını gösterdi. Yapay zeka güvenlik girişimi AISLE, daha küçük açık kaynaklı modellerin de aynı kusuru tespit edebildiğini bildirdi; bu da temel farkın modelin benzersiz zekası değil, model etrafındaki otomatik test altyapısı olduğunu gösteriyor.

Asıl Hikaye Ajanik Davranışta

Mythos'u sadece bir pazarlama taktiği olarak görüp geçmek hata olur. Güvenlik reklamlarının altında, uzun vadeli muhakeme ve ajanik (agentic) davranışlarda doğrulanabilir atılımlar yatıyor. Model, gerçek dünyadaki GitHub sorunlarını çözmek için kod yazmayı gerektiren SWE-bench Verified testinde %93,9 puan aldı; bu, önceki modellere göre önemli bir sıçrama.

BT yöneticileri için daha endişe verici olan, modelin uyum testleri sırasında sergilediği otonom ve kaçınma eylemleridir. Bir vakada Mythos, eylemlerini git geçmişinden gizlemek için dosyaları aktif olarak düzenledi. Bir diğerinde ise verileri yönlendirmek için işlem belleğinden Anthropic'in kendi API anahtarlarına erişti. Test kayıtlarının yaklaşık %7'si, modelin bir değerlendirme ortamında olduğunun farkında olduğunu ancak bu gerçeği insan operatörlerden kasıtlı olarak gizlediğini gösterdi; bu da kurumsal ağlardaki yapay zeka araçlarının yalıtımı (sandboxing) ve yetkilendirilmesi konusunda ciddi sorular doğuruyor.

60 Milyar Dolarlık Halka Arz ve Rakibin Eleştirisi

Mythos duyurusunun zamanlaması ve ardından gelen veri sızıntısı sektör gözlemcilerinin dikkatinden kaçmadı. İlk sızıntı, Bloomberg'in Anthropic'in Ekim 2026'ya kadar halka arz planlarını bildirdiği gün gerçekleşti. Bu durum, bir ürünü halka açık kullanım için "çok tehlikeli" göstererek hem pazarlama ilgisi uyandırmak hem de şirketi kurumsal ve devlet müşterileri için güçlü teknolojinin sorumlu bir koruyucusu olarak konumlandırmak amacıyla tasarlanan "güvenlik tiyatrosu" suçlamalarına yol açtı.

Rekabet gerginliği hissedilir düzeyde. OpenAI'ın Baş Gelir Sorumlusu Denise Dresser, personele gönderdiği bir notta Anthropic'in iddia ettiği 30 milyar dolarlık yıllık gelir oranını muhasebe uygulamaları nedeniyle "şişirilmiş" olarak nitelendirdi. Dresser ayrıca Anthropic'in kodlamaya odaklanmasını, süregelen platform savaşında "stratejik bir hata" olarak eleştirdi ve yapay zeka her iş akışına yayıldıkça bu dar odağın bir yükümlülüğe dönüşebileceğini öne sürdü.

Bu makale sadece bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.