Đổi mới hợp tác trong cơ sở hạ tầng AI

VDURAAdvanced Micro Devices (AMD) đã công bố ra mắt kiến trúc tham chiếu GPU AMD Instinct™ có khả năng mở rộng đầu tiên của họ, một sự phát triển quan trọng nhằm tối ưu hóa hiệu suất cho các môi trường trí tuệ nhân tạo (AI) và điện toán hiệu năng cao (HPC) đòi hỏi khắt khe. Bản thiết kế đã được xác thực này định nghĩa cách thức cấu hình tính toán, lưu trữ và mạng để triển khai GPU quy mô lớn một cách hiệu quả và có thể lặp lại.

Kiến trúc này tích hợp nền tảng lưu trữ VDURA V5000 với Bộ tăng tốc AMD Instinct™ MI300 Series, được thiết kế đặc biệt để loại bỏ các nút thắt cổ chai về hiệu suất và đơn giản hóa việc triển khai. Hệ thống được thiết kế để giữ cho GPU AMD Instinct™ được sử dụng tối đa, mang lại hiệu suất bền vững với trọng tâm là hiệu quả, khả năng mở rộng và đơn giản hóa hoạt động. Nó hỗ trợ tới 256 GPU AMD Instinct™ trên mỗi đơn vị có thể mở rộng, đạt được thông lượng ấn tượng lên tới 1,4 TB/giây và 45 triệu IOPS trong bố cục hoàn toàn bằng flash, cùng với khoảng 5 PB dung lượng khả dụng. Khả năng bền vững dữ liệu được đảm bảo thông qua mã hóa xóa đa cấp, với các tùy chọn mạng bao gồm 400 GbE hai mặt phẳng và InfiniBand NDR/NDR200 tùy chọn.

Ken Claffey, Giám đốc điều hành của VDURA, tuyên bố: "Việc công bố kiến trúc tham chiếu có khả năng mở rộng đầu tiên của chúng tôi với Bộ tăng tốc AMD Instinct™ MI300 Series nhấn mạnh cam kết chung của chúng tôi trong việc dẫn đầu cơ sở hạ tầng AI thế hệ tiếp theo." AMD đã chọn VDURA sau một đánh giá kỹ thuật, với lý do hiệu suất được tối ưu hóa cho GPU của VDURA, chi phí khách hàng thấp và khả năng mở rộng đã được chứng minh. Giải pháp này đã được một nhà tích hợp hệ thống liên bang Hoa Kỳ áp dụng cho một siêu cụm AI, thể hiện sự sẵn sàng của nó cho các khối lượng công việc quan trọng, nơi các đường ống AIHPC ngày càng bị hạn chế bởi giới hạn lưu trữ.

AMD đẩy mạnh chiến lược với dòng Instinct MI350

Sự hợp tác với VDURA phù hợp với chiến lược đẩy mạnh mạnh mẽ của AMD vào thị trường bộ tăng tốc AI đang phát triển, đặc biệt được nhấn mạnh bởi sự thành công dự kiến của Bộ xử lý đồ họa (GPU) dòng Instinct MI350 tiên tiến của hãng. AMD đang dự kiến doanh thu quý 3 năm 2025 đạt khoảng 8,7 tỷ USD, với khả năng biến động 300 triệu USD, một dự báo phần lớn được thúc đẩy bởi nhu cầu mạnh mẽ dự kiến và việc triển khai nhanh chóng của dòng MI350.

Hướng dẫn lạc quan này cho thấy một quỹ đạo tài chính đáng kể cho AMD, đại diện cho mức tăng khoảng 28% so với cùng kỳ năm trước và tăng 13% theo quý. Sự tăng trưởng này chủ yếu được quy cho sự mở rộng mạnh mẽ hai chữ số trong phân khúc Trung tâm Dữ liệu của hãng, nơi dòng Instinct MI350, bao gồm các mẫu MI350XMI355X, đóng một vai trò quan trọng. Được xây dựng trên kiến trúc CDNA 4 tiên tiến của AMD, các GPU này đã được giới thiệu chính thức tại các sự kiện công nghiệp quan trọng như Advancing AI và Hot Chips 2025 và được thiết kế đặc biệt để xử lý các khối lượng công việc AI đòi hỏi khắt khe nhất, từ đào tạo mô hình ngôn ngữ lớn (LLM) đến suy luận AIHPC.

Các thông số kỹ thuật chính của dòng MI350 nhấn mạnh sức mạnh của nó, với bộ nhớ HBM3E lên tới 288GB và băng thông bộ nhớ 8 TB/s, đảm bảo thông lượng lớn cho các tác vụ chuyên sâu. Dòng này hứa hẹn một bước nhảy vọt đáng kể về hiệu suất, bao gồm tăng gấp bốn lần trong các tác vụ tính toán AI và tăng gấp 35 lần tốc độ suy luận so với các mẫu trước đó. Lộ trình tích cực này định vị AMD là một đối thủ đáng gờm, với việc triển khai thành công dòng MI350 đánh dấu một thời điểm quan trọng trong sự chuyển đổi công nghệ rộng lớn hơn hướng tới cơ sở hạ tầng tập trung vào AI.

Tác động thị trường và bối cảnh cạnh tranh

Việc ra mắt kiến trúc tham chiếu VDURA-AMD và triển vọng mạnh mẽ cho dòng MI350 cho thấy một tâm lý tích cực đối với AMD và lĩnh vực AI/HPC rộng lớn hơn. Sự hợp tác này, bằng cách giải quyết các nút thắt cổ chai lưu trữ quan trọng cho việc triển khai AI quy mô lớn, có thể củng cố thị phần và doanh thu của AMD trong dài hạn, nâng cao vị thế cạnh tranh của hãng so với các đối thủ.

Nhu cầu tăng vọt đối với GPU AI là một biểu hiện trực tiếp của sự tăng trưởng thị trường bùng nổ. Thị trường GPU AI ước tính đạt 21,6 tỷ USD vào năm 2025 và dự kiến sẽ tăng vọt lên 265,5 tỷ USD vào năm 2035, với Tốc độ tăng trưởng kép hàng năm (CAGR) đáng kinh ngạc là 28,5%. Các nhà cung cấp dịch vụ đám mây đang nổi lên như những động lực chính của sự mở rộng này, thúc đẩy các khoản đầu tư lớn vào cơ sở hạ tầng trung tâm dữ liệu được hỗ trợ bởi GPU. AMD đang đạt được sức hút đáng kể trong các khối lượng công việc suy luận AI, một phân khúc đang ngày càng nhận được sự chú ý của ngành.

Tuy nhiên, bối cảnh cạnh tranh vẫn rất gay gắt. NVIDIA tiếp tục giữ vững vị trí thống trị, với thị phần ước tính 80-85% tính đến quý 3 năm 2025. Được củng cố bởi hệ sinh thái CUDA trưởng thành và việc ra mắt kiến trúc Blackwell sắp tới, NVIDIA vẫn là một trở ngại đáng kể đối với AMD. Mặc dù hệ sinh thái ROCm của AMD đã có những cải tiến nhanh chóng, nhưng nó vẫn còn tụt hậu so với CUDA về mức độ trưởng thành và sự quen thuộc của nhà phát triển. Các báo cáo cho thấy dòng MI350 của AMD có thể mang lại lợi thế chi phí 30% so với B200 của NVIDIA trong một số khối lượng công việc nhất định, và các nhà phân tích tại Wedbush lưu ý rằng GPU MI400 sắp tới của AMD dự kiến sẽ cạnh tranh với H100 của NVIDIA về chỉ số hiệu suất trên mỗi đô la, có khả năng làm xói mòn thị phần của NVIDIA trong số các khách hàng nhạy cảm về chi phí.

Intel cũng phải đối mặt với những thách thức gia tăng trong thị trường bộ tăng tốc AI. Dòng Gaudi của hãng được cho là đã không đạt được mục tiêu doanh thu khiêm tốn 500 triệu USD vào năm 2024 do doanh số bán hàng chậm và các vấn đề về "dễ sử dụng phần mềm". Việc AMD tiếp tục giành thị phần, không chỉ trong GPU AI mà còn trong CPU máy chủ (EPYC™) và CPU máy khách (Ryzen™), làm phức tạp thêm những nỗ lực của Intel nhằm giành lại vị thế trong các lĩnh vực truyền thống của hãng. Các hàm ý rộng hơn bao gồm sự phụ thuộc chuỗi cung ứng vào TSMC cho các quy trình sản xuất tiên tiến, gây ra các điểm lỗi đơn tiềm ẩn, và các yếu tố địa chính trị, chẳng hạn như các hạn chế xuất khẩu của Hoa Kỳ đối với chip AI tiên tiến sang Trung Quốc, vẫn là những trở ngại đáng kể.

Quan điểm ngành và triển vọng tương lai

Advanced Micro Devices đang đứng trước ngưỡng cửa của một kỷ nguyên chuyển đổi, được thúc đẩy bởi các hợp tác chiến lược và sự thành công dự kiến của GPU dòng Instinct MI350 cùng với hướng dẫn doanh thu mạnh mẽ. Con đường phía trước bao gồm việc điều hướng cạnh tranh gay gắt, mở rộng hệ sinh thái AI một cách siêng năng và tận dụng một cách chiến lược nhu cầu không ngừng nghỉ đối với cơ sở hạ tầng AI.

Kiến trúc tham chiếu VDURA-AMD là một bước cơ bản trong việc đảm bảo các triển khai hiệu quả, có khả năng mở rộng có thể tối đa hóa việc sử dụng GPU, giảm chi phí năng lượng và cải thiện hiệu quả tổng thể trong một môi trường nơi các đường ống AIHPC ngày càng bị hạn chế bởi dung lượng lưu trữ. Quỹ đạo tức thì và dài hạn của công ty sẽ được xác định bởi khả năng thực hiện lộ trình tích cực của mình và củng cố vị thế là một lực lượng thống trị trong trí tuệ nhân tạo, đòi hỏi phải giám sát chặt chẽ các tiến bộ của đối thủ cạnh tranh và động lực thị trường đang phát triển.