GPT-5.3-Codex %77.3 Puan Aldı, Rakip Modeli Geride Bıraktı
OpenAI, Anthropic ile doğrudan bir çatışma başlattı ve yeni programlama modeli GPT-5.3-Codex'i, Anthropic'in amiral gemisi güncellemesi Claude Opus 4.6'yı piyasaya sürdüğü Perşembe günü tam aynı anda tanıttı. Bu eş zamanlı lansman, kurumsal yapay zeka yazılım pazarı savaşında önemli bir tırmanışı işaret ediyor. OpenAI, yeni modelinin büyük bir atılım olduğunu ve programlama ajanları için temel terminal operasyon becerilerini ölçen bir test olan Terminal-Bench 2.0 kıyaslamasında %77.3 puan aldığını iddia ediyor. Bu, önceki modeline göre 13 puanlık bir iyileşmeyi temsil ediyor ve Anthropic'in Opus 4.6'sı tarafından bildirilen %65.4'lük puanı önemli ölçüde aşıyor.
Kıyaslamaların ötesinde, OpenAI önemli verimlilik artışlarını vurgulayarak, yeni modelin önceki modelinin yarısından daha az token gerektirdiğini ve çıkarım hızını %25'ten fazla artırdığını belirtti. Sektör için bir dönüm noktası olarak şirket, GPT-5.3-Codex'in erken sürümlerinin kendi geliştirme, hata ayıklama ve dağıtım süreçlerinde kullanıldığını da açıkladı. OpenAI CEO'su Sam Altman, "5.3-Codex'i inşa etmek için 5.3-Codex'i kullandığımızı izlemek... geleceğe dair güçlü bir bakış açısı sundu" dedi.
Kurumsal Yapay Zeka Harcamaları Şirket Başına 11.6 Milyon Dolara Ulaşacak, OpenAI'nin Liderliği Daralıyor
Teknolojik silahlanma yarışı, kurumsal yapay zeka harcamalarındaki patlama ile besleniyor. Andreessen Horowitz'den alınan bir ankete göre, büyük dil modellerine yapılan ortalama kurumsal harcama 2025'te 7 milyon dolara ulaşacak ve bu, 2024'te harcanan 2.5 milyon dolara göre %180'lik bir artış. Bu rakamın 2026'ya kadar %65 daha artarak 11.6 milyon dolara ulaşması bekleniyor. Hızla genişleyen bu "ödül havuzu", pazar payı rekabetini yoğunlaştırıyor.
Aynı veriler değişen bir manzarayı ortaya koyuyor. OpenAI baskın oyuncu olmaya devam etse de, kurumsal yapay zeka harcamalarındaki payının 2024'teki %62'den 2026'ya kadar %53'e düşmesi bekleniyor. Aynı dönemde Anthropic'in pazar payının %14'ten %18'e çıkması beklenirken, Google da pazarın daha büyük bir kısmını ele geçirecek. Bu rekabetçi baskı, son zamanlarda Altman ve Anthropic'in reklam stratejileri üzerine tartıştığı giderek daha açık hale gelen rekabeti açıklamaya yardımcı oluyor.
OpenAI, Codex'i Kodlayıcıdan Genel Amaçlı Ajana Genişletiyor
OpenAI, Codex'i özel bir programlama asistanından, geniş bir yelpazede bilgi işlerini halledebilecek çok yönlü bir ajana stratejik olarak yeniden konumlandırıyor. Şirket, modelin artık hata ayıklama ve dağıtımdan kullanıcı araştırmasına ve e-tablolardaki veri analizine kadar görevleri yönetebileceğini belirtti, bu da Microsoft ve Salesforce gibi oyuncuların hakim olduğu daha geniş kurumsal üretkenlik yazılım pazarına doğrudan bir meydan okuma sinyali veriyor.
Konumunu güçlendirmek için OpenAI, GPT-5.3-Codex'i siber güvenlikte "yüksek yetenekli" ilk modeli olarak da belirledi ve yazılım güvenlik açıklarını tespit etmek için özel olarak eğitildi. Benimsenmeyi ve savunma yeteneklerini hızlandırmak için Altman, siber güvenlik araştırmacılarına 10 milyon dolarlık API kredisi taahhüt ettiğini duyurdu.
Bu, inşa edenlerin çağıdır, onları kontrol etmek isteyenlerin değil.
— Sam Altman, CEO, OpenAI