Nhà phát triển GPU Trung Quốc Moore Threads đang chuyển từ bán chip sang cung cấp cơ sở hạ tầng AI hoàn chỉnh, nhằm chiếm lĩnh thị trường nội địa đang gặp khó khăn do các lệnh kiểm soát xuất khẩu của Hoa Kỳ.
Công ty GPU Trung Quốc Moore Threads đang triển khai nền tảng AI full-stack "từ đám mây đến biên", một thách thức trực tiếp đối với sự thống trị của Nvidia Corp. tại Trung Quốc bằng cách cung cấp một hệ thống tích hợp giữa phần cứng và phần mềm được thiết kế để hạ thấp rào cản cho các công ty đang chuyển đổi từ hệ sinh thái CUDA của Nvidia.
"Hiệu năng của một chiếc card đơn lẻ là điểm khởi đầu, nhưng khả năng của hệ thống mới là thứ ảnh hưởng đến việc mua hàng và tái mua hàng", tài liệu báo chí của công ty cho buổi ra mắt ngày 18 tháng 5 đã nêu rõ, báo hiệu một sự xoay trục chiến lược từ linh kiện sang cung cấp cơ sở hạ tầng AI tích hợp.
Buổi ra mắt bao gồm cụm tính toán exascale Kua’e, đã được triển khai và đạt mức sử dụng Model Flops (MFU) lên tới 60% trong việc đào tạo các mô hình lớn. Nó được bổ sung bởi MUSA SDK 5.1.0, hiện tương thích với CUDA 12.8 của Nvidia và hỗ trợ tất cả 3.194 toán tử PyTorch.
Động thái này giúp Moore Threads có vị thế để chiếm một phần trong thị trường AI ước tính trị giá 50 tỷ USD hàng năm của Trung Quốc, một phân khúc mà quyền tiếp cận của Nvidia đã bị hạn chế bởi các hạn chế xuất khẩu của Hoa Kỳ. Nếu thành công, chiến lược này có thể đẩy nhanh khả năng tự lực về AI của Trung Quốc và thách thức triển vọng doanh thu dài hạn của Nvidia trong khu vực, vốn chiếm 17,1 tỷ USD, tương đương 13% tổng doanh thu của họ, trước khi các biện pháp kiểm soát chặt chẽ nhất được thực thi.
Từ Nhà cung cấp GPU đến Kiến trúc sư Hệ thống
Thông báo của Moore Threads đánh dấu một bước tiến chiến lược quan trọng từ một nhà cung cấp phần cứng trở thành một kiến trúc sư hệ thống. Ma trận sản phẩm mới của công ty được xây dựng dựa trên cách tiếp cận ba hướng: cụm Kua’e cho đào tạo AI trên đám mây, các sản phẩm dựa trên SoC Changjiang mới cho các thiết bị biên và đầu cuối, và nền tảng MT Lambda để mô phỏng. Danh mục đầu tư tích hợp này được thiết kế để chứng minh cho các khách hàng doanh nghiệp quy mô lớn thấy rằng công ty có thể cung cấp và duy trì một quy trình làm việc AI phức tạp, toàn diện, một yếu tố quan trọng đối với những khách hàng thực hiện các dự án AI kéo dài nhiều năm.
Tại các thiết bị biên, công ty đã giới thiệu mô-đun E300, dựa trên SoC Changjiang, cung cấp 50 TOPS sức mạnh tính toán AI không đồng nhất cho các ứng dụng như kiểm tra công nghiệp, xe tự hành và robot yêu cầu suy luận cục bộ với độ trễ thấp. Bằng cách cung cấp một kiến trúc thống nhất từ đám mây đến biên, Moore Threads nhằm mục đích đơn giản hóa việc triển khai cho các nhà phát triển xây dựng các ứng dụng AI hỗn hợp.
Hạ thấp rào cản CUDA
Trong nhiều năm, trở ngại lớn nhất đối với bất kỳ đối thủ tiềm năng nào của Nvidia là CUDA, nền tảng phần mềm độc quyền của công ty đã trở nên ăn sâu vào cộng đồng phát triển AI. Moore Threads đang trực tiếp giải quyết thách thức này. Bằng cách mã nguồn mở vLLM-MUSA và đạt được hỗ trợ gốc trong khung phần mềm SGLang phổ biến, công ty đang nỗ lực giảm thiểu sự ma sát mà các nhà phát triển gặp phải khi rời khỏi hệ sinh thái của Nvidia.
Nỗ lực này giải quyết các vấn đề tương thích "đuôi dài"—chẳng hạn như các kernel tùy chỉnh và các phụ thuộc cũ—thường làm chệch hướng các dự án di trú. Mặc dù hỗ trợ các khung phần mềm chính là yêu cầu cơ bản, việc đảm bảo rằng toàn bộ nỗ lực kỹ thuật lịch sử của một công ty có thể được chuyển đổi một cách suôn sẻ mới là bài kiểm tra thực sự. Sự tập trung của Moore Threads vào ngăn xếp phần mềm MUSA của mình, bao gồm một công cụ di trú tự động, là một nỗ lực trực tiếp nhằm làm cho GPU của họ không chỉ có thể sử dụng được mà còn dễ dàng áp dụng cho một cộng đồng phát triển phần lớn được đào tạo trên các công cụ của Nvidia.
Nhắm mục tiêu vào AI hiện thân
Có lẽ thành phần hướng tới tương lai nhất của buổi ra mắt là nền tảng mô phỏng MT Lambda, đưa câu chuyện về GPU của Moore Threads vào lĩnh vực AI vật lý. Khi AI chuyển từ không gian kỹ thuật số sang tương tác với thế giới vật lý trong robot và lái xe tự động, nhu cầu về mô phỏng có độ trung thực cao trở nên tối quan trọng. Đào tạo các hệ thống này trong thế giới thực là tốn kém và nguy hiểm.
Moore Threads đang định vị "GPU toàn năng" của mình, tích hợp kết xuất đồ họa, mô phỏng vật lý và tính toán AI trên một chip duy nhất, như một nền tảng lý tưởng cho công việc này. Bằng cách cho phép tạo ra dữ liệu tổng hợp hiệu quả và xác thực các chính sách kiểm soát trong môi trường ảo, nền tảng này có thể trở thành một phần cơ sở hạ tầng quan trọng cho các công ty như Pony.ai và Zhipu AI, cả hai đều được liệt kê là đối tác. Động thái này đưa Moore Threads cạnh tranh không chỉ với phần cứng GPU của Nvidia mà còn với các nền tảng mô phỏng toàn diện của hãng như Omniverse.
Chiến lược này không phải là không có rủi ro. Bằng cách mở rộng phạm vi từ chip sang toàn bộ hệ thống, Moore Threads hiện đang cạnh tranh trên nhiều mặt trận—độ ổn định của đám mây, trải nghiệm nhà phát triển và hiệu suất ứng dụng trong thế giới thực. Tuy nhiên, với việc các hạn chế của Hoa Kỳ tạo ra cơ hội tiềm năng cho các công ty nội địa như Huawei và Moore Threads, cơ hội để nhúng sâu vào quá trình xây dựng AI của Trung Quốc có thể xứng đáng với rủi ro.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.