Nvidia, Yapay Zeka Ajanları İçin 120 Milyar Parametreli Modelini Tanıttı
Nvidia, karmaşık yapay zeka sistemlerinin verimliliğini artırmak amacıyla tasarlanmış güçlü, 120 milyar parametreli açık model Nemotron 3 Super'ı piyasaya sürdü. Model, Mamba, Transformer ve Uzman Karışımı (MoE) yönlendirmesini birleştiren hibrit bir mimari kullanıyor ve performansı en üst düzeye çıkarmak için çıkarım sırasında sadece 12 milyar parametre etkinleştiriliyor. Bu tasarım, çok ajanlı iş akışlarının standart sohbetlerden 15 kata kadar daha fazla token ürettiği "bağlam patlaması" sorununu ve her alt görev için büyük modelleri çalıştırmanın getirdiği "düşünme vergisi" sorununu doğrudan ele alıyor. 1 milyon tokenlık bağlam penceresiyle model, zorlu kurumsal uygulamalar için sürekli, çok adımlı muhakemeyi yönetmek üzere inşa edildi.
Yeni Model, Otonom Kurumsal Yapay Zekaya Geçişi Hızlandırıyor
Nemotron 3 Super'ın piyasaya sürülmesi, sektörün konuşma tabanlı sohbet robotlarından, karmaşık iş akışlarını planlayıp yürütebilen otonom yapay zeka ajanlarına doğru daha geniş bir geçiş yaptığının sinyalini veriyor. Nvidia, bu değişimi yazılım geliştirme, siber güvenlik üçlemesi ve endüstriyel otomasyon veya "fiziksel yapay zeka" gibi alanlarda desteklemek için teknolojisini konumlandırıyor. Açık ağırlıklar, veri kümeleri ve eğitim tarifleriyle modeli piyasaya sürerek şirket, geliştiricileri platformunda inşa etmeye teşvik ediyor ve donanım ekosistemini güçlendiriyor. Bu strateji, Palantir, Dell ve Perplexity gibi ortakların halihazırda Nemotron 3 Super'ı hizmetlerini ve iş akışlarını otomatikleştirmesiyle ilgi görüyor.
Açık Strateji, Yapay Zeka Fikri Mülkiyet Risklerini Artırıyor
Açık modeller inovasyonu ve donanım talebini hızlandırırken, aynı zamanda modelin çekirdek zekası olan ağırlıklarını fikri mülkiyet hırsızlığı için yüksek değerli bir hedef haline getiriyor. Model ağırlıkları çalınırsa düşmanların modelin yeteneklerini kopyalayabilmesi stratejik riski önemli kılıyor. 2024'te bir Google mühendisinin Çinli şirketler için yapay zeka ticari sırlarını çalmakla suçlanması bu tehdidi vurgulamıştı. Yapay zeka sistemleri kritik altyapı haline geldikçe, sektör, en hassas model varlıklarını içeriden gelen tehditlerden ve dış saldırılardan korumak için Anthropic gibi laboratuvarlar tarafından kullanılan çok taraflı doğrulama kontrolleri gibi daha güçlü güvenlik önlemleri alma baskısı altında.