Ucuz ve sınırsız AI dönemi sona eriyor — ve zeka için iki kademeli bir pazar ortaya çıkıyor.
Coinbase Üst Yöneticisi (CEO) Brian Armstrong, sektörün sübvanse edilmiş fiyatlandırmanın sürdürülemezliğiyle yüzleştiği bir dönemde, yapay zeka iş yüklerinin %80'inin 12 ila 18 ay içinde günümüzün öncü sistemlerinden %99 daha ucuz modellere kayacağını öngördü.
"Sınırlayıcı faktör daha iyi modeller değil, enerji ve işlem gücü olacak," diyen Armstrong, yatırımcı Tommy Shaughnessy'nin ölçümlü API fiyatlandırmasının kurumsal AI harcamalarını sabit ücretli aboneliklerin şirketlerin beklediğinin çok ötesine taşıdığını özetleyen bir gönderisine yanıt olarak Pazar günü X'te yazdı. Armstrong, Coinbase'in halihazırda uygun olduğu durumlarda sorguları daha ucuz modellere yönlendirdiğini ve token kullanımı katlanarak artarken AI maliyetlerini "kabaca sabit" tuttuğunu söyledi.
Coinbase CEO'sunun tahmini, Microsoft'un GitHub Copilot'unun 1 Haziran'da sabit abonelikten token bazlı faturalamaya geçmesinin ardından geldi; bu değişiklik bazı kullanıcılar için fatura artışlarını %1.700'e kadar çıkardı. Bir abone, dahili maliyet tahminlerinde aylık ücretlerinin 44,68 dolardan 754,29 dolara fırladığını gösterirken, bir diğeri 847 dolarlık bir fatura öngördü. Fiyatlandırma revizyonu daha geniş bir hesaplaşmayı yansıtıyor: Shaughnessy'ye göre OpenAI'in işletme marjı yaklaşık -%122 seviyesinde, yani şirket GPU satın alımlarını ve çıkarım maliyetlerini sübvanse etmek için tamamen dış sermayeye güveniyor.
İki Kademeli Zeka Pazarı
Armstrong'un çerçevesi, AI kullanımını iki kategoriye ayırıyor. Bilimsel araştırma, ajan orkestrasyonu ve "IQ maksimizasyonu" adını verdiği alanlar dahil olmak üzere en yüksek performansı gerektiren iş yüklerinin kalan %20'si, Anthropic'in Opus 4.8 veya OpenAI'in GPT-5.5 gibi öncü modellerde çalışmaya devam edecek. Diğer %80'lik kısım ise daha ucuz alternatiflere kayacak; Armstrong bu durumu, çoğu alıcının MacBook'lar ve oyun bilgisayarlarında en üst düzey özellikleri atladığı tüketici donanımına benzetti.
Ekonomi şimdiden bu ayrışmayı destekliyor. Shaughnessy'ye göre DeepSeek V4, SWE-bench kodlama benchmark'ında Anthropic'in Claude Opus'una yakın bir performans sergilerken maliyeti yaklaşık otuzda biri seviyesinde. Hugging Face CEO'su Clement Delangue, Stanford araştırmasına atıfta bulunarak, gerçek dünya konuşma ve akıl yürütme sorgularında yerel model doğruluğunun 2023'te %23,2'den %71,3'e yükseldiğini ve bunun API çağrılarının enerji ve maliyetinin çok altında bir maliyetle gerçekleştiğini belirtti.
Box CEO'su Aaron Levie, Armstrong'un %99'luk rakamını "biraz aşırı" olarak nitelendirdi ancak AI kullanımının katmanlaşacağı, üst düzey işlerin önde gelen modellere, yüksek hacimli görevlerin ise ucuz modellere gideceği konusunda hemfikirdi. "Zeka tahsisi son derece önemli olacak," diye yazdı Harvey kurucu ortağı Winston Weinberg. Glean kurucu ortağı Tony Gentilcore, Armstrong'un analizini "nokta atışı" olarak nitelendirerek "finansal piyasaların Opus fiyatlarını sonsuz ölçeğe taşıyan tek kesim olduğunu" ekledi.
Yatırım Açısı
Daha ucuz modellere geçiş, pazar payı oluşturmak için sübvanse edilmiş aboneliklere güvenen OpenAI, Microsoft ve Anthropic dahil olmak üzere premium AI sağlayıcılarının gelir modellerini tehdit ediyor. İş yüklerinin %80'i düşük maliyetli alternatiflere kayarsa, öncü modeller için toplam adreslenebilir pazar önemli ölçüde daralıyor. Maliyet verimli çıkarım sağlayan şirketler — açık kaynak model sağlayıcıları ve yönlendirme altyapısı dahil — bundan faydalanacak konumda. H100 ve B200 GPU'ları çoğu öncü eğitime güç sağlayan Nvidia, daha karmaşık bir görünümle karşı karşıya: işlem gücü talebi artabilir, ancak daha ucuz alternatifler çoğaldıkça fiyatlandırma gücü aşınabilir.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.