Tencent'in Hy3 AI Modeli Kodlama Yeteneğini %40 Artırarak Claude'a Rakip Oldu

Tencent Holdings Ltd., bugüne kadarki en yetenekli büyük dil modelini yayınladı. Kriter skorları, kodlama alanında nesiller arası %40'lık bir iyileşme göstererek modelin, Anthropic ve Google'dan rakipleriyle maliyetin çok küçük bir kısmıyla doğrudan rekabete girmesini sağlıyor.

Tencent, yayınla birlikte yaptığı açıklamada, "Model üç şeyi dengelemek için oluşturuldu: yetenek genişliği, dürüst değerlendirme ve maliyet verimliliği" dedi. Şirket model ağırlıklarını açık kaynaklı hale getirdi ve bulut platformu üzerinden API erişimi sunuyor.

Yeni model Hy3 preview, çıkarım sırasında yalnızca 21 milyar parametreyi aktif tutan 295 milyar parametreli bir Uzmanlar Karması (MoE) sistemidir. Bir modelin GitHub'daki gerçek dünya hatalarını düzeltme yeteneğini değerlendiren SWE-bench Verified kodlama testinde Hy3, selefinin %53,0'lık skorundan dramatik bir sıçrama yaparak %74,4 puan aldı. Bu skor onu GLM-5 (%77,8) ve Kimi-K2.5 (%76,8) gibi rakiplerinin önüne geçirirken, Anthropic'in Claude Opus 4.6 modeline (%80,8) oldukça yaklaştırıyor.

Bu sürüm, Tencent için ticari olarak uygulanabilir yapay zekaya doğru stratejik bir eksen değişimini işaret ediyor; modelin fiyatlandırması ve mimarisi büyük ölçekli dağıtım için tasarlandı. Tencent için Satın Al notunu ve 783 HK$ hedef fiyatını koruyan Citigroup analistleri, modelin kalite, hız ve maliyeti dengelemeye odaklanmasını kurumsal benimseme için "doğru stratejik yön" olarak nitelendirdi. Milyon girdi token'ı başına yaklaşık 0,18 dolar olan fiyatlandırma, karşılaştırılabilir GPT-4 sınıfı modellerden yaklaşık %90 daha ucuzdur.

Ticari Uygulanabilirliğe Odaklanma

Tencent, yetenek kazanımlarının modeli kitlesel dağıtımın dışına itecek kadar pahalılaşmasını önlemek için modeli ve çıkarım çerçevesini birlikte tasarlayarak açıkça kurumsal pazarı hedefliyor. Sorguları uzmanlaşmış alt ağlara yönlendiren MoE mimarisi, sorgu başına hesaplama maliyetlerini önemli ölçüde düşürerek bu stratejinin anahtarını oluşturuyor. Şirket, önceki amiral gemisi modelinin 400 milyardan fazla parametreye sahip olduğunu, ancak akıl yürütme olgunluğu ile maliyet arasında optimal bir denge bulmak için bu rakamı bilinçli olarak geri çektiklerini belirtti.

Model halihazırda Yuanbao, QQ ve Tencent Docs dahil olmak üzere ondan fazla Tencent ürününe entegre edilmiş durumda. CodeBuddy ve WorkBuddy gibi dahili uygulamalarda şirket, ilk token gecikmesinin %54 düştüğünü ve uçtan uca üretim süresinin %47 azaldığını bildirdi; bu da modelin karmaşık ajan iş akışları için üretim ortamlarındaki kararlılığını kanıtlıyor.

Altyapı Revizyonu Hız Kazandırıyor

Hy3 önizleme modeli, sıfırdan açık kaynaklı sürüme üç aydan kısa bir sürede ulaştı; Tencent bu zaman çizelgesini Şubat ayında ön eğitim ve pekiştirmeli öğrenme yığınını tamamen elden geçirmesine bağlıyor. Baş Yapay Zeka Bilimcisi Yao Shunyu liderliğindeki bu yeniden yapılandırma, eğitim önceliklerini canlı metriklerle şekillendirmek için model geliştirme döngüsünü doğrudan ürün ekipleriyle entegre etme ilkesiyle yönlendirildi.

Model ve ürünün bu sıkı entegrasyonu, Tencent'e çok az rakibinin eşleşebileceği bir veri çarkı (data flywheel) sağlıyor ve şirketin gerçek dünyadaki kullanıcı etkileşimlerini hızlı model iyileştirmelerine dönüştürmesine olanak tanıyor. Hy3 bazı kriterlerde hala OpenAI ve Google DeepMind'ın mutlak öncü modellerinin gerisinde kalsa da, maliyet başına performans oranı onu yapay zeka altyapısı yarışında dişli bir yeni katılımcı yapıyor.

Bu makale yalnızca bilgilendirme amaçlıdır ve yatırım tavsiyesi teşkil etmez.