Nvidia'nın yeni açık kaynaklı modeli Nemotron 3 Nano Omni, daha hızlı ve daha verimli kurumsal AI ajanları oluşturmak için metin, vizyon ve sesi birleştirmeyi hedefliyor.
Geri
Nvidia'nın yeni açık kaynaklı modeli Nemotron 3 Nano Omni, daha hızlı ve daha verimli kurumsal AI ajanları oluşturmak için metin, vizyon ve sesi birleştirmeyi hedefliyor.

Nvidia Corp., daha verimli kurumsal AI ajanları oluşturmak için tasarlanmış açık kaynaklı bir model olan Nemotron 3 Nano Omni'nin lansmanıyla bir donanım sağlayıcısından kapsamlı bir platform şirketine dönüşüyor. Metin, vizyon ve ses yeteneklerini birleştiren model, rakip açık omni-modellerden dokuz kata kadar daha hızlı çıktı sunabiliyor; bu hamle hem tescilli modellere hem de diğer açık kaynaklı alternatiflere meydan okuyor.
Bulut altyapı şirketi Vultr'un CEO'su J.J. Kardwell, "Müşterilerimiz için kurumsal AI çıkarımını yeniden icat etmek amacıyla NVIDIA Nemotron'u benimsedik" dedi. Erken benimseyenlerden biri olan Vultr, modeli GPU kümelerinde ve sunucusuz çıkarım hizmeti aracılığıyla kullanıma sunuyor.
Yeni model, herhangi bir zamanda yalnızca 3 milyar parametreyi etkinleştiren 30 milyar parametreli bir Mixture-of-Experts (MoE) mimarisine sahip olup yüksek performansı maliyet verimliliğiyle dengeliyor. Vizyon ve ses kodlayıcılarını tek bir çerçeve içinde birleştirerek, ayrı algı modüllerine olan ihtiyacı ortadan kaldırıyor, gecikmeyi ve maliyeti düşürüyor. Model, hem üst düzey tüketici donanımlarında hem de kurumsal bulut dağıtımlarında çalışacak şekilde tasarlanmıştır ve Nvidia NIM mikro hizmeti olarak ve Hugging Face gibi platformlarda mevcuttur.
Lansman, Nvidia'yı AI değer zincirinden daha büyük bir pay almaya konumlandırıyor; GPU satmanın ötesine geçerek ajansal AI (agentic AI) için temel modeller ve araçlar sağlıyor. Bu strateji, Nvidia'nın "açık ve performanslı" ekosistemini kapalı kaynak liderlerine ve diğer açık kaynak topluluklarına karşı konumlandırıyor. Erken benimseyenler arasında Palantir Technologies Inc. ve Foxconn Technology Group yer alırken, Dell Technologies Inc., Oracle Corp. ve Infosys Ltd. gibi şirketler şu anda modeli değerlendiriyor. Bu hamle, Nvidia'nın sadece AI altın madenindeki "kürekleri" değil, tüm inşaat planını sağlayan ana tedarikçi olmayı hedeflediğini gösteriyor.
Nemotron 3 Nano Omni, karmaşık ve çok adımlı görevleri anlayabilen, muhakeme edebilen ve yürütebilen sistemler olan ajansal AI için özel olarak tasarlanmıştır. Modeli GUI verileri üzerinde eğiten Nvidia, modelin kullanıcı arayüzü öğelerini kavramasını ve onlarla etkileşime girmesini sağlayarak ofis iş akışlarını ve yazılım operasyonlarını otomatikleştirmenin önünü açıyor. Bir başka erken benimseyen olan H Company'nin CEO'su Gautier Cloix, "Kullanışlı ajanlar oluşturmak için bir modelin ekranı yorumlamasını saniyelerce bekleyemezsiniz. Nemotron 3 Nano Omni üzerine inşa ederek ajanlarımız, daha önce pratik olmayan tam HD ekran kayıtlarını hızla yorumlayabiliyor" dedi. Yürütme ve gerçek dünya etkileşimine odaklanan bu hamle, içerik üretmekten eylemleri gerçekleştirmeye geçen AI'lar oluşturma rekabetinde önemli bir adımı temsil ediyor.
Nvidia, Nemotron 3 Nano Omni'yi açık bir model olarak sunarak donanımı etrafında bir geliştirici ekosistemi geliştiriyor. Şirket sadece model ağırlıklarını değil, aynı zamanda gelişimi teşvik etmek için eğitim verilerini ve NeMo araç setini de sağlıyor. Bu strateji, kapalı bir sisteme kilitlenmeden özelleştirilebilir, yüksek performanslı AI çözümleri arayan geniş bir geliştirici ve işletme kitlesini çekebilir. Geçtiğimiz yıl Nemotron ailesi için 50 milyondan fazla indirme ile Nvidia güçlü bir temel oluşturuyor. Bu açık, çok modüllü modelin başarısı, kurumlarda AI ajanlarının benimsenmesini hızlandırabilir ve Nvidia'nın sektörün geleceğindeki merkezi rolünü sağlamlaştırabilir.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.