Huawei dẫn dắt cuộc chuyển dịch chip của Trung Quốc khi thị phần của Nvidia về 0

Ngành công nghiệp chip AI Trung Quốc đã từ bỏ nỗ lực sao chép GPU đa năng của Nvidia, chuyển hướng sang ASIC tùy chỉnh, loại bỏ tính linh hoạt để đổi lấy hiệu suất thô — một sự thay đổi mang tính cấu trúc được đẩy nhanh bởi các lệnh kiểm soát xuất khẩu liên tục của Mỹ nhằm chặn quyền truy cập vào các bộ xử lý mạnh nhất của Mỹ.

"Các doanh nghiệp có năng lực kỹ thuật AI mạnh mẽ và lộ trình rõ ràng sẽ được hưởng lợi từ ASIC, trong khi những doanh nghiệp chạy khối lượng công việc hỗn hợp vẫn nghiêng về GPU đa năng," Su Lian Jye, nhà phân tích trưởng tại Omdia, cho biết.

Huawei Technologies được dự báo sẽ chiếm 62% thị trường máy gia tốc AI nội địa Trung Quốc vào năm 2026, tiếp theo là Cambricon Technologies với 14%, theo một báo cáo của Morgan Stanley công bố ngày 8/5. Baidu và Alibaba Group mỗi công ty dự kiến sẽ chiếm khoảng 5% trong số các công ty công nghệ lớn đang xây dựng chip độc quyền. Huawei kỳ vọng doanh thu chip AI sẽ đạt khoảng 12 tỷ USD vào năm 2026, tăng từ 7,5 tỷ USD vào năm 2025. Thị phần của Nvidia tại thị trường máy gia tốc AI Trung Quốc về cơ bản đã giảm xuống 0, một diễn biến mà Giám đốc điều hành Jensen Huang mô tả là một "kết cục tồi tệ" đối với Mỹ vì nó phá vỡ sự phụ thuộc phần mềm vào hệ sinh thái CUDA của Nvidia.

Sự phân kỳ này kéo theo những hệ quả dài hạn cho các nhà đầu tư. Nếu ngành công nghiệp AI Trung Quốc chuẩn hóa theo hỗn hợp các bộ xử lý thần kinh của Huawei, bộ xử lý song song của Alibaba và chip chuyên dụng theo miền của Cambricon — mỗi loại chạy trên nền tảng phần mềm riêng — kết quả sẽ là một hệ sinh thái phân mảnh nhưng tự cung tự cấp trong nước, vận hành dựa trên các giả định kiến trúc khác biệt căn bản so với phương Tây do Nvidia thống trị. Sự khóa chặt CUDA của Nvidia, được xây dựng trong hai thập kỷ, đang phải đối mặt với thách thức đáng tin cậy đầu tiên.

Ba kiến trúc, một hướng đi

Các công ty Trung Quốc đang theo đuổi ba thiết kế ASIC riêng biệt. Huawei đặt cược vào bộ xử lý thần kinh thông qua dòng Ascend, bao gồm 910C được triển khai rộng rãi và Ascend 950 sắp ra mắt. Cambricon đang xây dựng kiến trúc chuyên dụng theo miền với dòng Siyuan 590 và 690. Đơn vị bán dẫn T-Head của Alibaba vừa ra mắt bộ xử lý song song Zhenwu M890 tại hội nghị điện toán đám mây thường niên tuần trước, tuyên bố hiệu suất gấp ba lần thế hệ trước.

Về phía GPU, Moore Threads — được thành lập năm 2020 bởi Zhang Jianzhong, cựu giám đốc điều hành của Nvidia tại Trung Quốc — dẫn đầu nỗ lực nội địa với các chip đa năng như dòng MTT S5000. Biren Technology, Enflame và Iluvatar CoreX cũng đang cạnh tranh, nhưng chưa có công ty nào đạt được quy mô của những nhà dẫn đầu ASIC.

Khoảng cách hiệu suất giữa chip Trung Quốc và phần cứng tuân thủ xuất khẩu của Nvidia đã thu hẹp đáng kể. Dữ liệu của Morgan Stanley cho thấy thẻ Ascend 950 của Huawei và Siyuan 690 của Cambricon có thể vượt trội hơn H20 của Nvidia — con chip mạnh nhất mà Nvidia hiện được phép bán cho Trung Quốc — từ 50% đến 150% tính theo token mỗi giây. Bản thân H20 chỉ mạnh bằng khoảng một phần sáu so với H200 của Nvidia, theo một báo cáo của Hội đồng Quan hệ Đối ngoại.

Thách thức về nền tảng phần mềm

Hiệu suất phần cứng chỉ là một nửa của phương trình. Thách thức sâu sắc hơn đối với ngành công nghiệp chip Trung Quốc là phá vỡ sự khóa chặt được tạo ra bởi nền tảng CUDA của Nvidia — lớp phần mềm mà hàng triệu nhà phát triển AI trên toàn thế giới sử dụng để viết mã cho phần cứng Nvidia. Hầu như mọi khung AI, mọi bài nghiên cứu và mọi mô hình được huấn luyện sẵn đều giả định khả năng tương thích với CUDA.

Huawei đang xây dựng CANN như một giải pháp thay thế, trong khi Moore Threads đã phát triển MUSA. DeepSeek đã dành nhiều tháng để viết lại mã lõi nhằm hoạt động với khung CANN của Huawei, rời xa hệ sinh thái CUDA. Nhưng nhà phân tích bán dẫn Zhang Haijun lưu ý rằng khi các mô hình AI ngày càng phức tạp, ranh giới giữa ASIC tùy chỉnh và GPU linh hoạt đang "trở nên mờ nhạt," cho thấy kiến trúc chiến thắng cuối cùng có thể kết hợp các yếu tố của cả hai.

Đối với thị trường AI mang tính thương mại hóa cao của Trung Quốc, vốn tập trung vào việc triển khai các ứng dụng cho hàng trăm triệu người dùng thay vì nghiên cứu tiên phong, cách tiếp cận ASIC đặc biệt hợp lý. Suy luận — quá trình chạy một mô hình đã được huấn luyện ở quy mô lớn — đền đáp cho loại tối ưu hóa hẹp mà silicon tùy chỉnh mang lại. Việc huấn luyện các mô hình mới vẫn được hưởng lợi từ tính linh hoạt của GPU, nhưng doanh thu nằm ở khâu triển khai.

Hệ quả dài hạn của sự phân kỳ này có thể quan trọng hơn các điểm chuẩn hiệu suất ngắn hạn. Nếu ngành công nghiệp AI Trung Quốc chuẩn hóa trên chip và nền tảng phần mềm nội địa, sự hợp tác AI xuyên biên giới sẽ trở nên khó khăn hơn khi các nền tảng tính toán cơ bản không tương thích. Và việc thiếu một nền tảng thống trị duy nhất có nghĩa là không có nhà sản xuất chip Trung Quốc nào được hưởng lợi từ loại khóa chặt hệ sinh thái đã khiến CUDA của Nvidia trở nên mạnh mẽ như vậy ngay từ đầu.

Cổ phiếu Nvidia, đang giao dịch ở mức khoảng 35 lần thu nhập dự phóng, phải đối mặt với một gánh nặng cấu trúc từ việc mất doanh thu tại Trung Quốc. Trong khi mảng kinh doanh trung tâm dữ liệu của công ty vẫn thống trị toàn cầu — tạo ra 62 tỷ USD trong năm tài chính vừa qua — sự xói mòn mảng kinh doanh tại Trung Quốc đã loại bỏ một động lực tăng trưởng mà các nhà phân tích trước đây đã mô hình hóa như một cơn gió thuận kéo dài nhiều năm. Câu hỏi dành cho các nhà đầu tư là liệu hệ sinh thái silicon tùy chỉnh mà Trung Quốc đang xây dựng có thể theo kịp tốc độ đổi mới của phương Tây do Nvidia dẫn dắt hay không.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.