Tencent, AI stratejisini parametre sayılarını kovalamaktan, yeni açık kaynaklı modeliyle maliyet etkin, gerçek dünya görev yürütmesini optimize etmeye kaydırıyor.
Geri
Tencent, AI stratejisini parametre sayılarını kovalamaktan, yeni açık kaynaklı modeliyle maliyet etkin, gerçek dünya görev yürütmesini optimize etmeye kaydırıyor.

Tencent Holdings Ltd., 23 Nisan'da Hy3 önizleme modelini tanıttı; bu, 295 milyar parametreli açık kaynaklı bir yapay zeka sistemi olup, salt ölçeği kovalamak yerine verimlilik ve pratik uygulamaya yönelik stratejik bir dönüşün sinyalini veriyor. Bu lansman, Çinli teknoloji devi için, yerel yapay zeka yarışı yoğunlaşırken karmaşık ve gerçek dünya görevleri için maliyet etkin bir model oluşturmaya odaklanan önemli bir yeniden yapılandırmayı temsil ediyor.
"Hy3 önizlemesi, Hunyuan büyük model yeniden inşasının ilk adımıdır," dedi Tencent'in baş yapay zeka bilimcisi ve büyük dil modelleri bölümü başkanı Yao Shunyuan bir açıklamada. "Bu açık kaynak ve yayının, Hy3'ün resmi versiyonunun pratikliğini artırmaya yardımcı olmak için açık kaynak topluluğundan ve kullanıcılardan gerçek geri bildirimler alacağını umuyoruz."
Yeni model, toplam 295 milyar parametreli bir Uzman Karışımı (MoE) mimarisi kullanıyor ancak herhangi bir görev için yalnızca 21 milyar parametreyi aktif hale getiriyor ve 256K bağlam penceresi ile birlikte geliyor. Bu tasarım, üst düzey yetenekleri daha düşük operasyonel maliyetlerle dengelemeyi amaçlıyor. Dahili testler, modelin CodeBuddy ve WorkBuddy gibi AI ajanları dahilindeki dahili ürünlerde ilk belirteç gecikmesinde (first-token latency) yüzde 54'lük bir azalma ve uçtan uca sürede yüzde 47'lik bir düşüş sağladığını ve yüzde 99,99'dan fazla bir başarı oranına ulaştığını gösteriyor.
Bu hamle, Tencent'in, sektördeki en büyük modele sahip olmasa bile, üstün mühendislik ve geniş ürün ekosistemine derin entegrasyonun rekabet avantajı sağlayabileceğine dair bahse girdiğini gösteriyor. Bu durum, Tencent ve rakibi Alibaba Group'un, 20 milyar doların üzerinde bir değerleme arayan yapay zeka girişimi DeepSeek'e yatırım yapmak için görüşmelerde bulunduğu bir döneme denk geliyor; bu da içeride geliştirme yaparken gelecek vaat eden üçüncü taraf teknolojilere yatırım yapma şeklindeki ikili stratejiyi işaret ediyor.
Hy3'ün piyasaya sürülmesi, Tencent'in yapay zeka felsefesinde net bir değişikliği işaret ediyor. Şirket artık 300 milyar parametre aralığını, karmaşık akıl yürütme ve uzun bağlam anlama gibi temel yeteneklerin tamamen kilidinin açıldığı ve boyuttaki daha fazla artışın azalan getiriler sağladığı optimum bir denge noktası olarak görüyor. Bu, bir modelin gücünün ana ölçüsü olarak sürekli daha büyük parametre sayılarına odaklanan sektörün önceki eğilimine karşı çıkıyor.
Bu yeniden yapılandırma, Tencent'in yapay zeka ekiplerinin yeniden organize edilmesini ve Şubat ayında yeni altyapıların kurulmasını takip ediyor. Odak noktası artık karmaşık iş akışlarını yürütebilen "AI Ajanları" üzerinde; Tencent'in bulut ve akıllı endüstri CEO'su Tang Daosheng'in yeni paradigma olarak adlandırdığı bir kavram. Tencent, Hy3 önizlemesini açık kaynaklı hale getirerek gerçek dünya kullanım verilerini toplamayı ve resmi sürüm için modeli geliştirmeyi hedefliyor.
Tencent'in pragmatik yaklaşımı, yoğun rekabet ve kaynak kısıtlamaları zemininde şekilleniyor. Modelleri eğitme ve ölçeklendirmenin yüksek maliyeti, ABD'nin Nvidia gibi şirketlerden gelen gelişmiş yarı iletkenlere yönelik ihracat kısıtlamalarıyla birleşerek Çinli firmaları Huawei gibi sağlayıcılardan gelen yerli alternatifleri değerlendirmeye zorluyor.
Bu ortamda verimlilik her şeyden önemlidir. Tencent'in kur yaptığı bildirilen girişim DeepSeek, Batılı meslektaşları tarafından kullanılan bütçenin küçük bir kısmıyla güçlü modeller geliştirerek itibar kazandı. Tencent'in bir yandan kendi verimlilik odaklı Hy3 modelini başlatırken diğer yandan DeepSeek'ten pay alma arayışı, iki yönlü bir stratejiyi vurguluyor: ekosistemi için güçlü ve entegre kurum içi modeller geliştirmek, yatırımları ise diğer yenilikçilere maruz kalmak ve teknolojik kör noktalara karşı korunmak için kullanmak. Bu ikili yaklaşımın başarısı, Çin'in benzersiz derecede zorlu yapay zeka pazarında yol almak için kritik olacaktır.
Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.