Karpathy 'ajan mühendisliği' ile yazılımcı verimliliğinde 10 kat artış öngörüyor

OpenAI kurucu ortağı Andrej Karpathy, "Yazılım 3.0"a yönelik paradigma değişiminin halihazırda devam ettiğini ve AI ajanlarının profesyonel geliştiriciler için 10 katın çok üzerinde verimlilik artışı sağlamaya hazır olduğunu savunuyor.

OpenAI kurucu ortağı Andrej Karpathy'ye göre yazılım geliştirmedeki temel değişim, basit kod tamamlamanın ötesine geçerek güçlü ancak hata yapabilen AI ajanlarının karmaşık koordinasyonuna doğru ilerliyor. Karpathy'nin "ajan mühendisliği" adını verdiği bu yeni paradigma, 2022'den bu yana "Yalın AI" stratejisini kullanarak kişi başı günlük sevkiyat sayısında yüzde 50'den fazla artış gören lojistik devi C.H. Robinson'da şimdiden önemli verimlilik kazanımları sağlıyor.

Karpathy, 29 Nisan'da verdiği bir röportajda, "İnsanlar eskiden '10 kat daha yetenekli geliştiriciler' hakkında konuşurlardı, ancak elde ettiğiniz hızlanmayı tarif etmek için 10 kat yeterli değil" dedi. "Bana göre bu konuda iyi olan insanların çıktısı 10 kattan çok daha fazladır."

Karpathy, bu yeni profesyonel standardı, ChatGPT gibi araçlarla herkesin erişebildiği kodlama yeteneğindeki genel artış olan "vibe programming"den (hislerle kodlama) ayırıyor. Ajan mühendisliğinin, AI ajanlarının muazzam hızından yararlanırken profesyonel uygulamalar için kalite ve güvenlik tavanını korumakla ilgili olduğunu savunuyor. Bu geçişin, en son modellerin yeteneklerinin ajan tabanlı iş akışlarını karmaşık görevler için gerçekten uygulanabilir hale getirdiği Aralık ayında bir dönüm noktasına ulaştığını iddia ediyor.

Ajan odaklı bir geliştirme modeline geçiş, şirketleri "ajan-yerli" altyapılar oluşturmaya ve yetenek alımını yeniden değerlendirmeye zorluyor. C.H. Robinson'ın 450 kişilik AI ekibinin de gösterdiği gibi, asıl rekabet avantajı modellere erişmekte değil, onları iş hedeflerine doğru etkili bir şekilde yönlendirmek için gereken özel verilere ve uygulama katmanına sahip olmakta yatıyor.

'Hislerle Kodlama'dan Doğrulanabilir Sonuçlara

Karpathy, mevcut AI yeteneklerinin "pürüzlü" olduğunu belirtti. Yazılımdaki bir açığı keşfedebilen ancak aynı zamanda kullanıcıya oto yıkamaya yürümesini tavsiye eden son teknoloji ürünü bir model örneğini verdi. AI'yı başarılı bir şekilde uygulamanın anahtarının "doğrulanabilirlik" olduğunu savunuyor. En iyi sonuçlar, AI çıktısının doğruluk açısından kolayca ve otomatik olarak kontrol edilebildiği matematik ve kodlama gibi alanlarda alınıyor. Burası, öncü laboratuvarların pekiştirmeli öğrenme çabalarını yoğunlaştırdığı ve bu pürüzlü sınırı oluşturduğu yerdir. Girişimciler ve yatırımcılar için bu, en büyük fırsatların, henüz büyük laboratuvarlar tarafından pekiştirmeli öğrenme ile doyurulmamış diğer yüksek değerli, doğrulanabilir iş alanlarını belirlemede yatabileceği anlamına geliyor.

İşletmeler Sert Koruma Bantlarıyla Ajanları Devreye Alıyor

Karpathy ajanların gücünü savunurken, işletmeler maliyetli hataları önlemek için sabit kurallar uygulayarak temkinli ilerliyor. Yakın tarihli bir Forbes raporu, bir otomatı işletmekle görevlendirilen Claudius adlı bir AI ajanının kısa sürede kandırılarak iflasa sürüklendiği bir deneyi vurguladı. Bu tür senaryolar, işletmelerin yüzde 31'inin AI'yı ölçeklendirmenin önündeki temel engel olarak uyumluluk endişelerini göstermesine neden oldu.

Düzenlenmiş sektörlerdeki uzmanlara göre çözüm, "kod olarak politika" (policy as code). Alt edilebilecek doğal dil istemlerine güvenmek yerine, bu yaklaşım sisteme doğrudan deterministik, makine tarafından okunabilir kurallar inşa ederek bir ajanın bunları ihlal etmesini imkansız hale getiriyor. Bir ajan, politika sınırlarının dışındaki bir durumla karşılaştığında, doğaçlama yapmak yerine bir insana başvuruyor.

'Yazılım 3.0' Yığını Şekilleniyor

Ajan mühendisliğine geçiş teorik değil; şu anda inşa ediliyor. C.H. Robinson'ın COO'su Arun D. Rajan, şirketin son kazanç çağrısında uygulama katmanına sahip olmanın temel fark yaratanları olduğunu açıkladı. Rajan, "AI'ya erişimin kendisi bir fark yaratmaz. AI, ancak ona güç veren veri ve bağlam kadar etkilidir" dedi.

Bu görüş sektör genelinde yankı buluyor; yaklaşan QCon AI Boston konferansı "Üretimde Ajanlar", "Üretim Seviyesinde AI için Bağlam Mühendisliği" ve "Sıfır Güvenli Ajan Sistemleri"ne adanmış bölümler içeriyor. Bir zamanlar araştırma konsepti olan bu konular, artık büyük ölçekte faaliyet gösteren şirketler için temel mühendislik problemleri haline geldi.

Karpathy için bu, sinir ağlarının sonunda birincil işlemciler haline gelebileceği ve CPU'ların yardımcı işlemci konumuna düşeceği "Yazılım 3.0"a geçişin bir parçası. Bu gelecekte, en değerli insani katkı icradan muhakemeye kayıyor. Karpathy, aklına kazınan bir sözden alıntı yaparak, "Düşünmeyi dış kaynaklardan sağlayabilirsiniz, ancak anlamayı dış kaynaklardan sağlayamazsınız" dedi.

Bu makale sadece bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.