Robotik girişimi Physical Intelligence, yeni AI modelinin bir robotu daha önce hiç eğitilmediği görevleri yerine getirmesi için yönlendirdiği bir araştırma buluşunun ardından, şirkete yaklaşık 11 milyar dolar değer biçecek yeni bir finansman turu için görüşmelerde bulunuyor; bu rakam önceki değerlemesinin neredeyse iki katı. İki yıllık şirketin yeni modeli π0.7, "bileşimsel genelleme" adını verdiği yeteneği sergiliyor; bu, bir robotun farklı bağlamlarda öğrendiği becerileri yeni sorunları çözmek için birleştirmesine olanak tanıyan ve genel amaçlı bir robot beynine doğru atılmış önemli bir adım olan, uzun süredir aranan bir yetenektir.
Physical Intelligence kurucu ortağı ve UC Berkeley profesörü Sergey Levine, "Yalnızca veri topladığınız işi tam olarak yapmaktan, her şeyi yeni yollarla gerçekten yeniden harmanlamaya başladığı o eşiği bir kez geçtiğinde, yetenekler veri miktarıyla doğrusal olmaktan çok daha fazla artıyor" dedi. Bu ölçekleme özelliğinin dil ve vizyon gibi diğer AI alanlarında da görüldüğünü belirterek, robotik alanının da benzer bir dönüm noktasında olabileceğini öne sürdü.
Temel iddia, modelin parçalanmış bilgileri sentezleme yeteneğine odaklanıyor. Kilit bir gösterimde π0.7, eğitim verilerinde cihazla ilgili yalnızca iki kısa ve alakasız bölüm bulunmasına rağmen, bir robotun tatlı patates pişirmek için hava fritözü kullanmasını sağladı. Model; kahve yapma ve çamaşır katlama gibi karmaşık ev işlerinde uzmanlaşmış, tek görevli modellerin performansıyla boy ölçüştü. Physical Intelligence bugüne kadar 1 milyar doların üzerinde fon topladı ve son olarak 5,6 milyar dolar değerindeydi.
Bu teknolojik ilerleme, genel amaçlı robotların ticarileşmesini hızlandırabilir ve imalattan lojistiğe kadar sektörleri potansiyel olarak dönüştürebilir. Yatırımcılar için bu, AI ve robotik sektöründe daha fazla yatırım ve birleşme ve satın alma faaliyetini tetikleyebilecek büyük bir gelişme anlamına geliyor. Ancak şirket, ticari bir dağıtım takvimi sunmayı kesin bir dille reddetti; bu tutum, Figma ve Notion gibi şirketleri destekleyen saygın eski melek yatırımcı Lachy Groom'un kariyeri sayesinde yatırımcıları caydırmadı.
Ezbere Dayalı Öğrenmeden "Peru'daki Tekboynuzlar"a
π0.7 ile elde edilen başarı, her özel görev için devasa veri setleri toplamaya dayanan (bir tür ezberleme biçimi) standart robotik eğitim paradigmasından bir kopuşu işaret ediyor. Bileşimsel genelleme yoluyla model, önceden öğrenilmiş ve görünüşte alakasız bilgileri birleştirerek yeni bir görevin nasıl gerçekleştirileceğini çıkarsayabiliyor. Levine bu şaşırtıcı sonuçları, araştırmacıların GPT-2 dil modelinin And Dağları'ndaki tekboynuzlar hakkında -hiç öğretilmediği halde- bir hikaye oluşturduğunu ilk gördükleri anla karşılaştırdı.
Physical Intelligence araştırma bilimcisi Ashwin Balakrishna, "Deneyimim her zaman, verilerin içinde ne olduğunu derinlemesine bildiğimde, modelin ne yapabileceğini bir şekilde tahmin edebileceğim yönündeydi" dedi. "Nadiren şaşırırım. Ancak son birkaç ay, gerçekten şaşırdığım ilk zaman dilimi oldu."
Araştırma ekibi, modelin mevcut sınırlamaları konusunda dürüst kalmaya devam ediyor. Model henüz "bana biraz tost yap" gibi tek bir üst düzey komutla karmaşık, çok aşamalı görevleri yerine getiremiyor. Ancak adım adım sözlü talimatlarla koçluk yapıldığında mükemmel performans sergiliyor; bu da robotların yeni ortamlara yerleştirilebileceğini ve yeniden eğitilmeye gerek kalmadan insan işçiler tarafından yerinde eğitilebileceğini gösteriyor. Bir deneyde, araştırmacıların istemleri hassaslaştırmak için 30 dakika harcamasının ardından hava fritözü görevi için başarı oranı yüzde 5'ten yüzde 95'e fırladı.
11 Milyar Dolarlık Soru
Araştırma genellemenin "erken belirtileri" tanımlanarak dikkatli bir ihtiyatla sunulurken, finansal yansımalar daha ani oldu. Physical Intelligence'ın değerini 11 milyar dolara yaklaştıran yeni bir tur için yapıldığı bildirilen görüşmeler, yatırımcıların AI'da temel ilerlemeler gösteren şirketlere yönelik yoğun iştahının altını çiziyor. Bu değerleme, özellikle bir ürün dağıtım programı taahhüdünde bulunmamış bir şirket için dikkat çekicidir.
Levine, sergilenen görevlerin havada takla atan robotların viral videolarına kıyasla "sıkıcı" olduğu yönündeki olası eleştirilere karşı çıktı. Genellemenin her zaman özenle koreografisi yapılmış bir gösteriden daha az dramatik görüneceğini ancak çok daha kullanışlı olduğunu ve gerçek sınırı temsil ettiğini savundu. Şirketin net bir gelir yolu olmadan önde gelen kurumsal sermayeyi çekme yeteneği, robotik genelleme problemini çözmenin "kazananın her şeyi aldığı" bir ödül olduğu inancına dayanıyor.
Gerçek dünyada dağıtım takvimi sorulduğunda Levine spekülasyon yapmaktan kaçındı ancak ilerlemenin "birkaç yıl önce beklediğimden daha hızlı" olduğunu söyledi. Yatırımcılar için bahis, belirli bir ürün üzerine değil, Physical Intelligence'ın bir gün ekonomideki geniş robotik sistem dizisine güç verebilecek temel "beyni" inşa ettiği fikri üzerinedir.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.