Nvidia'nın Cosmos 3'ü, çip üreticisinin robotik için temel yapay zeka modellerine girişini işaret ediyor ve görüntü muhakemesini çok modlu üretimle birleştiriyor.
Nvidia'nın fiziksel yapay zeka için ilk tamamen açık omni modeli olan Cosmos 3, şirketi GPU donanımının ötesine taşıyarak, dünya simülasyonu ve robotik için transformatör karışımı mimarisiyle temel model alanına giriyor.
Şirket, 1 Haziran tarihli duyurusunda, "Cosmos 3, görüntü, dil ve eylemi birleştiren çığır açıcı bir transformatör karışımı mimarisi üzerine inşa edilmiş, liderlik tablosunun zirvesinde yer alan açık bir fiziksel yapay zeka temel modelidir" dedi.
Model, yerel görüntü muhakemesini destekliyor ve sentetik veri oluşturma ile fiziksel yapay zeka politikası geliştirme için metin, görüntü, video, ortam sesi ve eylem çıktıları üretiyor. Nvidia ayrıca, Omniverse, Cosmos ve Metropolis platformlarını kapsayan bir dizi açık kaynaklı fiziksel yapay zeka aracı becerisinin yanı sıra 32 milyar parametreli açık muhakeme görüntü-dil-eylem modeli Alpamayo 2 Super'i de piyasaya sürdü.
Temel modellere yapılan bu genişleme, Nvidia'yı 2025 mali yılında 62 milyar dolar gelir elde eden veri merkezi GPU işinin ötesinde değer yakalamak için konumlandırıyor. Otonom araçlar, depo robotiği ve endüstriyel otomasyonu kapsayan fiziksel yapay zeka, Cosmos'un robotik geliştirme için standart platform haline gelmesi durumunda şirketin 35 kat ileri fiyat/kazanç çarpanını haklı çıkarabilecek yeni bir adreslenebilir pazarı temsil ediyor.
Cosmos 3'ün temelini oluşturan transformatör karışımı mimarisi, Nvidia'nın önceki yapay zeka modellerinden teknik bir ayrışmayı temsil ediyor. Metni sırayla işleyen büyük dil modellerinin aksine, Cosmos 3 görüntü, dil ve eylem verilerini eşzamanlı olarak işleyerek fiziksel dünya etkileşimlerini simüle etmesini sağlıyor; bu, robotları ve otonom sistemleri gerçek dünyada deneme yanılma olmadan eğitmek için gereken bir yetenek.
Açık kaynaklı yayın stratejisi, Meta'nın Llama dil modeli ailesiyle izlediği yaklaşımı yansıtarak Cosmos 3'ü robotik araştırma ve geliştirme için potansiyel bir standart haline getiriyor. Modeli ücretsiz olarak sunarak Nvidia, eğitim ve çıkarım için donanımına güvenen bir geliştirici ve şirket ağı oluşturmayı ve GPU işinin etrafında bir yazılım koruma siperi yaratmayı hedefliyor.
Rekabetçi riskler, Nvidia'nın doğrudan çip rakiplerinin ötesine uzanıyor. Tesla, otonom sürüş ve insansı robotik için kendi yapay zeka modellerini geliştirirken, Google DeepMind, MuJoCo ve Gemini platformları aracılığıyla fiziksel dünya simülasyonuna yoğun yatırım yaptı. Amazon, robotik bölümü aracılığıyla, depo otomasyonunda hem potansiyel bir müşteri hem de bir rakip olarak karşımıza çıkıyor.
Yatırımcılar için soru, Cosmos 3'ün ağ benimsenmesini GPU talebine dönüştürüp dönüştüremeyeceğidir. Her bir fiziksel yapay zeka eğitim çalışması binlerce Nvidia GPU'su gerektiriyor; tek bir robotik model eğitim oturumu haftalar boyunca 10.000 ila 25.000 H100 eşdeğeri GPU tüketebiliyor. Cosmos 3'ün fiziksel yapay zeka geliştirme için varsayılan platform haline gelmesi, mevcut büyük dil modeli yapılanmasının ötesinde yeni bir veri merkezi sermaye harcaması döngüsünü tetikleyebilir.
Nvidia hisseleri, Microsoft, Amazon ve Google'dan gelen yapay zeka altyapı harcamalarının etkisiyle son 12 ayda %140 değer kazandı. Cosmos 3 lansmanı, anlatıyı veri merkezi GPU'larının ötesine, ARK Invest'in 2040 yılına kadar küresel gelirinin 24 trilyon dolara ulaşabileceğini tahmin ettiği robotik ve fiziksel yapay zekaya taşıyor.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımaz.