- OpenAI, Realtime API'sine üç yeni ses modeli ekledi.
- Modeller; gerçekçi konuşmalar, çeviri ve transkripsiyon için tasarlandı.
- Yeni özellikler, çeşitli sektörlerdeki kurumsal müşterileri hedefliyor.
Geri

OpenAI Perşembe günü, geliştiricilere daha duyarlı ve yetenekli ses destekli uygulamalar oluşturmaları için araçlar sağlamayı amaçlayan üç yeni ses modelini Realtime API'sinde yayınladı. GPT-Realtime-2, GPT-Realtime-Translate ve GPT-Realtime-Whisper adlı yeni modeller; karmaşık konuşma görevlerini, canlı çeviriyi ve gerçek zamanlı transkripsiyonu gerçekleştirmek üzere tasarlandı. Bu hamle, sesli yapay zeka pazarındaki yerleşik oyunculara doğrudan bir meydan okuma niteliği taşıyor.
Şirket, "Lansmanını yaptığımız modeller hep birlikte, gerçek zamanlı sesi basit bir soru-cevap mantığından gerçekten iş yapabilen sesli arayüzlere taşıyor: konuşma ilerledikçe dinlemek, akıl yürütmek, çevirmek, yazıya dökmek ve harekete geçmek," açıklamasında bulundu.
Amiral gemisi model GPT-Realtime-2, GPT-5 sınıfı akıl yürütme yeteneğiyle inşa edildi ve selefine göre daha karmaşık kullanıcı taleplerini karşılayacak şekilde tasarlandı. Şirket ayrıca 70'ten fazla giriş dilini ve 13 çıkış dilini destekleyen GPT-Realtime-Translate ile canlı konuşmadan metne transkripsiyon için GPT-Realtime-Whisper'ı da kullanıma sundu. Yeni modeller OpenAI'nin Realtime API'sinde mevcut olup, fiyatlandırma GPT-Realtime-2 için token tüketimine, Translate ve Whisper için ise dakika başına faturalandırmaya dayanıyor.
Bu modellerin piyasaya sürülmesinin sesli yapay zeka alanındaki rekabeti kızıştırması ve benzer hizmetler sunan şirketleri etkilemesi bekleniyor. Yeni yetenekler özellikle müşteri hizmetleri, eğitim ve medya gibi kurumsal kullanım durumları için önem taşıyor. OpenAI, içerik yönergelerini ihlal eden konuşmaları durdurma yeteneği de dahil olmak üzere teknolojinin kötüye kullanımını önlemek için güvenlik önlemleri uyguladığını belirtti. Bu lansman, OpenAI'nin rekabetçi konumunu güçlendiriyor ve API'sinin benimsenmesini artırarak büyümeyi tetikleyebilir. Yapay zeka ürün paketini güçlendirmesi nedeniyle ana ortağı Microsoft için yükseliş sinyali (bullish) niteliğindedir.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.