ERNIE 5.1 của Baidu cắt giảm 94% chi phí huấn luyện AI

AI ERNIE 5.1 mới của Baidu đã cắt giảm 94% chi phí tiền huấn luyện so với các mô hình quy mô lớn tương tự, một động thái thách thức chiến lược thâm dụng vốn đang thống trị lĩnh vực này và định vị gã khổng lồ công nghệ Trung Quốc như một người dẫn đầu trong phát triển AI tiết kiệm chi phí.

Baidu giải thích: "Bí quyết nằm ở 'tiền huấn luyện đàn hồi đa chiều' (multi-dimensional elastic pre-training)", chi tiết hóa một phương pháp trích xuất và nén một mạng con từ kiến trúc ERNIE 5.0 hiện có thay vì xây dựng mô hình mới từ đầu.

Việc nén đã giảm tổng số tham số xuống còn khoảng một phần ba mô hình gốc và cắt giảm một nửa các tham số hoạt động, tuy nhiên ERNIE 5.1 vẫn giành được vị trí thứ tư toàn cầu trên bảng xếp hạng LMArena Search với số điểm 1.223. Trên tiêu chuẩn toán học AIME26, mô hình này đạt 99,6% với sự hỗ trợ của công cụ, chỉ đứng sau Gemini 3.1 Pro của Google.

Đối với Baidu (BIDU), được giao dịch trên Nasdaq, việc đạt được hiệu suất hàng đầu chỉ với 6% chi phí huấn luyện hàng triệu đô la thông thường mang lại một lợi thế cạnh tranh đáng kể. Đột phá này gây áp lực trực tiếp lên các đối thủ như OpenAI, Google và Microsoft, đồng thời lặp lại sự gián đoạn thị trường do mô hình suy luận chi phí thấp năm 2025 của DeepSeek gây ra, điều có thể thúc đẩy sự chuyển hướng trên toàn thị trường sang các kiến trúc hiệu quả hơn và mang lại lợi ích cho vị thế của Baidu trong cuộc đua AI toàn cầu.

Một tiêu chuẩn mới về hiệu quả huấn luyện

Cách tiếp cận của Baidu với ERNIE 5.1 đánh dấu một sự rời bỏ đáng kể khỏi triết lý "càng lớn càng tốt" đang thịnh hành trong ngành. Thay vì phải chịu chi phí tính toán khổng lồ để huấn luyện một mô hình mới từ đầu, công ty đã kế thừa cơ sở kiến thức từ mô hình cha ERNIE 5.0 lớn hơn của mình. Chiến lược ưu tiên hiệu quả này phản ánh tác động của mô hình R1 của DeepSeek vào năm 2025, mô hình đã sánh ngang với hiệu suất o1 của OpenAI với chi phí cho mỗi truy vấn thấp hơn 98% và gây ra sự điều chỉnh 600 tỷ USD giá trị thị trường của Nvidia.

Công nghệ nền tảng cho mô hình mới là một hệ thống học tăng cường bốn giai đoạn mà Baidu gọi là Multi-Teacher On-Policy Distillation (MOPD). Hệ thống này huấn luyện song song các mô hình chuyên gia cho mã nguồn, lập luận và các nhiệm vụ tác nhân (agentic tasks). Những kỹ năng chuyên biệt này sau đó được tinh lọc (distilled) vào một mô hình thống nhất duy nhất, một phương pháp được thiết kế để ngăn chặn "hiệu ứng bập bênh" nơi việc cải thiện một khả năng sẽ làm suy giảm khả năng khác. Giai đoạn học trực tuyến cuối cùng đã tinh chỉnh các kỹ năng hội thoại mở.

Cạnh tranh và Tác động Thị trường

Hiệu suất của ERNIE 5.1 giúp nó vượt lên trên tất cả các mô hình Trung Quốc khác và tiến sát các đối thủ phương Tây. Khả năng tác nhân của nó, vốn rất quan trọng cho các nhiệm vụ phức tạp, nhiều bước, đã vượt qua tiêu chuẩn trước đó của Trung Quốc là DeepSeek-V4-Pro. Trên tiêu chuẩn GPQA, thước đo khả năng trả lời các câu hỏi cấp độ chuyên gia của mô hình, ERNIE 5.1 tiệm cận hiệu suất của các mô hình nguồn đóng hàng đầu từ phương Tây.

Thành tựu này cho phép Baidu, đơn vị kiểm soát hơn 76% thị trường tìm kiếm của Trung Quốc, nâng cao các dịch vụ của mình mà không phải chịu toàn bộ gánh nặng chi phí huấn luyện mô hình biên giới (frontier model). Công ty cho biết ERNIE 5.1 đã được triển khai trên hơn 10 nền tảng tại Trung Quốc, từ các ứng dụng nhập vai AI đến các công cụ tạo kịch bản ngắn.

Đối với các nhà đầu tư, thành công của Baidu trong việc hạ thấp đáng kể chi phí huấn luyện trong khi duy trì hiệu suất cạnh tranh có thể là một tín hiệu lạc quan. Nó gợi ý rằng nhu cầu về phần cứng và tính toán AI, vốn đã thúc đẩy các đợt tăng giá cổ phiếu như Nvidia, có thể không phải là con đường duy nhất dẫn đến thành công. Baidu dự kiến sẽ cung cấp thêm thông tin chi tiết về các ứng dụng công nghiệp tại hội nghị nhà phát triển Create 2026 ở Bắc Kinh vào ngày 13-14 tháng 5, một sự kiện sẽ được theo dõi chặt chẽ để tìm kiếm các dấu hiệu về chiến lược mở rộng toàn cầu và doanh nghiệp của họ.

Bài viết này chỉ dành cho mục đích thông tin và không cấu thành lời khuyên đầu tư.