Tencent đang chuyển dịch chiến lược AI từ việc chạy đua số lượng tham số sang tối ưu hóa việc thực thi tác vụ thực tế, hiệu quả về chi phí với mô hình mã nguồn mở mới của mình.
Quay lại
Tencent đang chuyển dịch chiến lược AI từ việc chạy đua số lượng tham số sang tối ưu hóa việc thực thi tác vụ thực tế, hiệu quả về chi phí với mô hình mã nguồn mở mới của mình.

Tencent Holdings Ltd. vào ngày 23 tháng 4 đã công bố mô hình Hy3 bản xem trước, một hệ thống trí tuệ nhân tạo mã nguồn mở với 295 tỷ tham số, đánh dấu một bước chuyển chiến lược hướng tới tính hiệu quả và ứng dụng thực tế thay vì chạy theo quy mô thuần túy. Sự ra mắt này đại diện cho một sự điều chỉnh đáng kể đối với gã khổng lồ công nghệ Trung Quốc, tập trung vào việc tạo ra một mô hình hiệu quả về chi phí cho các nhiệm vụ phức tạp, thực tế khi cuộc đua AI trong nước đang gia tăng.
"Hy3 bản xem trước là bước đi đầu tiên trong quá trình tái cấu trúc mô hình lớn Hunyuan," Yao Shunyuan, nhà khoa học AI trưởng của Tencent và là người đứng đầu bộ phận mô hình ngôn ngữ lớn, cho biết trong một tuyên bố. "Chúng tôi hy vọng rằng việc phát hành mã nguồn mở này sẽ nhận được phản hồi thực tế từ cộng đồng mã nguồn mở và người dùng để giúp cải thiện tính thực tiễn của phiên bản Hy3 chính thức."
Mô hình mới sử dụng kiến trúc Mixture-of-Experts (MoE) với tổng cộng 295 tỷ tham số nhưng chỉ kích hoạt 21 tỷ tham số cho bất kỳ nhiệm vụ nhất định nào, cùng với cửa sổ ngữ cảnh 256K. Thiết kế này nhằm cân bằng giữa khả năng cao cấp với chi phí vận hành thấp hơn. Các thử nghiệm nội bộ cho thấy mô hình giúp giảm 54% độ trễ mã báo (first-token latency) và giảm 47% thời gian thực thi từ đầu đến cuối trên các sản phẩm nội bộ như các tác nhân AI CodeBuddy và WorkBuddy, với tỷ lệ thành công lớn hơn 99,99%.
Động thái này cho thấy Tencent đang đặt cược rằng kỹ thuật vượt trội và sự tích hợp sâu rộng vào hệ sinh thái sản phẩm khổng lồ của mình có thể mang lại lợi thế cạnh tranh, ngay cả khi không sở hữu mô hình lớn nhất ngành. Điều này diễn ra khi Tencent và đối thủ Alibaba Group được cho là đang đàm phán để đầu tư vào DeepSeek, một công ty khởi nghiệp AI đang tìm kiếm mức định giá hơn 20 tỷ USD, cho thấy chiến lược kép là vừa xây dựng nội bộ vừa mua lại các công nghệ bên thứ ba đầy hứa hẹn.
Việc phát hành Hy3 đánh dấu một sự thay đổi rõ rệt trong triết lý AI của Tencent. Công ty hiện coi phạm vi 300 tỷ tham số là điểm cân bằng tối ưu, nơi các khả năng cốt lõi như lập luận phức tạp và hiểu ngữ cảnh dài được khai phá hoàn toàn, và việc tăng thêm kích thước chỉ mang lại lợi ích giảm dần. Điều này đi ngược lại với sự tập trung trước đây của ngành vào số lượng tham số ngày càng lớn như thước đo chính cho sức mạnh của một mô hình.
Sự tái điều chỉnh này diễn ra sau một cuộc cải tổ các nhóm AI của Tencent và việc thiết lập cơ sở hạ tầng mới vào tháng 2. Trọng tâm hiện nay là các "Tác nhân AI" có thể thực hiện các quy trình làm việc phức tạp, một khái niệm mà CEO mảng đám mây và công nghiệp thông minh của Tencent, Tang Daosheng, đã gọi là mô hình tiếp theo. Bằng cách mở mã nguồn Hy3 bản xem trước, Tencent đặt mục tiêu thúc đẩy sự tiến hóa của mình bằng cách thu thập dữ liệu sử dụng thực tế, tinh chỉnh mô hình cho bản phát hành chính thức.
Cách tiếp cận thực dụng của Tencent đặt trong bối cảnh cạnh tranh gay gắt và hạn chế về nguồn lực. Chi phí đào tạo và mở rộng mô hình cao cộng với các hạn chế xuất khẩu của Hoa Kỳ đối với các chất bán dẫn tiên tiến từ các công ty như Nvidia, buộc các công ty Trung Quốc phải đánh giá các lựa chọn thay thế trong nước từ các nhà cung cấp như Huawei.
Trong môi trường này, tính hiệu quả là tối thượng. DeepSeek, công ty khởi nghiệp mà Tencent được cho là đang theo đuổi, đã xây dựng danh tiếng của mình nhờ phát triển các mô hình mạnh mẽ với một phần nhỏ ngân sách so với các đối tác phương Tây. Việc Tencent tìm kiếm cổ phần trong DeepSeek, đồng thời tung ra mô hình Hy3 tập trung vào hiệu quả của riêng mình, làm nổi bật chiến lược hai hướng: phát triển các mô hình nội bộ tích hợp, mạnh mẽ cho hệ sinh thái của mình trong khi sử dụng các khoản đầu tư để tiếp cận các nhà đổi mới khác và phòng ngừa rủi ro trước các ngõ cụt công nghệ. Sự thành công của cách tiếp cận kép này sẽ rất quan trọng trong việc điều hướng thị trường AI đầy thách thức của Trung Quốc.
Bài viết này chỉ dành cho mục đích thông tin và không cấu thành lời khuyên đầu tư.