Vera Rubin của Nvidia phải đối mặt với đối thủ cạnh tranh tầm rack đầu tiên đáng tin cậy khi nền tảng Helios của AMD bước vào sản xuất, đe dọa vị thế thống trị của hãng chip trong cơ sở hạ tầng AI.
Vera Rubin của Nvidia phải đối mặt với đối thủ cạnh tranh tầm rack đầu tiên đáng tin cậy khi nền tảng Helios của AMD bước vào sản xuất, đe dọa vị thế thống trị của hãng chip trong cơ sở hạ tầng AI.

Cổ phiếu Nvidia chỉ tăng 7,3% từ đầu năm đến nay, tụt lại gần 94 điểm phần trăm so với mức tăng 101% của Chỉ số Bán dẫn PHLX, khi việc chi tiêu cho chip AI mở rộng sang các đối thủ bao gồm cả Advanced Micro Devices đe dọa sự thống trị của công ty trên thị trường bộ tăng tốc trung tâm dữ liệu trị giá hơn 200 tỷ USD.
"Sự sụt giảm giá cổ phiếu của các ông lớn siêu quy mô trong tháng này cho thấy áp lực ngày càng tăng từ cổ đông yêu cầu biện minh cho khoản chi tiêu của họ, và chúng tôi thừa nhận rằng rủi ro tăng trưởng chi tiêu vốn chậm lại đã tăng lên ở mức cận biên," Mark Haefele, giám đốc đầu tư tại UBS Global Wealth Management, viết trong một báo cáo nghiên cứu.
Vera Rubin NVL72 thế hệ tiếp theo của Nvidia — hiện đang trong giai đoạn sản xuất và hướng tới tám đối tác đám mây đã được xác nhận trong nửa cuối năm 2026 — cung cấp 3,6 exaFLOPS suy luận FP4 và 2,5 exaFLOPS huấn luyện FP8 trên 72 GPU Rubin R100 mỗi rack, với băng thông NVLink 6 đạt 260 terabyte mỗi giây. Nhưng nền tảng Helios của AMD, được xây dựng xung quanh Instinct MI455X trên tiến trình 2 nanomet của TSMC (nơi chứa nhiều bóng bán dẫn hơn trên mỗi milimét vuông, cải thiện hiệu suất trên mỗi watt), đáp trả với 432 gigabyte bộ nhớ HBM4 trên mỗi GPU — nhiều hơn 50% so với 288 gigabyte của Vera Rubin — giúp Helios có tổng cộng 31 terabyte bộ nhớ mỗi rack so với 20,7 terabyte của hệ thống Nvidia.
Lợi thế bộ nhớ không chỉ là vẻ bề ngoài. Khi chạy suy luận trên các mô hình nghìn tỷ tham số — khối lượng công việc chiếm ưu thế trong các triển khai khách hàng lớn nhất của AMD, theo Giám đốc điều hành Lisa Su — dung lượng bộ nhớ quyết định liệu mô hình có vừa trên một rack duy nhất hay phải được phân vùng trên nhiều hệ thống, tạo ra chi phí giao tiếp làm chậm thông lượng. Nvidia duy trì lợi thế cấu trúc trong huấn luyện, nơi Vera Rubin đạt 2,5 exaFLOPS ở FP8 so với 1,4 exaFLOPS của Helios, và trong kiến trúc kết nối được tối ưu hóa cho định tuyến mixture-of-experts, mô hình chiếm ưu thế trong các mô hình AI tiên tiến.
Bức Tranh Cạnh Tranh Mở Rộng
Các cam kết từ khách hàng của AMD cung cấp nền tảng vững chắc cho luận điểm phần cứng. Công ty và OpenAI đã công bố thỏa thuận cơ sở hạ tầng 6 gigawatt vào tháng 10 năm 2025, với công suất gigawatt đầu tiên của dòng MI450 bắt đầu được triển khai trong nửa cuối năm 2026. Oracle Cloud Infrastructure cam kết triển khai 50.000 GPU dòng MI450 bắt đầu từ quý 3 năm 2026, xây dựng thứ mà họ mô tả là siêu cụm AI công khai đầu tiên trên các rack AMD Helios. Rackspace Technology đã ký một thỏa thuận dứt khoát vào ngày 16 tháng 6 để triển khai theo giai đoạn 30 megawatt năng lực tính toán AMD trên các trung tâm dữ liệu toàn cầu từ cuối năm 2026 đến năm 2028.
Doanh thu mảng Trung tâm Dữ liệu của AMD đạt 5,8 tỷ USD trong quý 1 năm 2026, tăng 57% so với cùng kỳ năm trước. Cantor Fitzgerald đã nâng mục tiêu giá cổ phiếu AMD lên 700 USD từ 500 USD vào ngày 29 tháng 6 — mức cao nhất trên Phố Wall — với lý do đà tăng trưởng hàng đầu của công ty trong lĩnh vực bán dẫn.
Mối đe dọa cạnh tranh không chỉ dừng lại ở AMD. Các nhà thiết kế chip tùy chỉnh bao gồm Broadcom và Marvell Technology, cùng với dòng chip tăng tốc AI mới nổi của Intel, đang cạnh tranh cho ngân sách mua sắm của các ông lớn siêu quy mô vốn đang phải đối mặt với sự giám sát ngày càng chặt chẽ. Các công ty công nghệ lớn có thể chống lại việc phụ thuộc chủ yếu vào một nhà cung cấp duy nhất ngay cả khi Vera Rubin của Nvidia thiết lập được khoảng cách hiệu suất rõ ràng, đặc biệt là khi các cổ đông đặt câu hỏi về quy mô chi tiêu vốn.
Những Gì Vera Rubin Phải Chứng Minh
Nvidia đã sửa đổi thông số kỹ thuật của Vera Rubin tại CES vào tháng 1, tăng băng thông bộ nhớ HBM4 lên 10% đặc biệt để dẫn trước MI455X — một tín hiệu cho thấy công ty coi trọng mối đe dọa từ AMD. Rubin NVL72 cung cấp 22 terabyte mỗi giây băng thông trên mỗi GPU so với 19,6 terabyte mỗi giây của Helios, và kết nối NVLink 6 của Nvidia cung cấp kết nối all-to-all đầy đủ được tối ưu hóa cho các mô hình định tuyến mixture-of-experts chiếm ưu thế trong kiến trúc mô hình AI tiên tiến.
Nhưng Helios của AMD sử dụng kết nối hệ sinh thái mở — UALink-over-Ethernet chạy trên phần cứng Ethernet tiêu chuẩn 800 gigabit mỗi giây — nghĩa là các nhà vận hành trung tâm dữ liệu có thể tìm nguồn cung cấp thiết bị mạng từ các nhà cung cấp cạnh tranh thay vì từ một nhà cung cấp duy nhất. Bộ chuyển mạch NVLink của Nvidia chỉ có sẵn từ Nvidia, một khoản chi phí mà Helios tránh được.
Câu hỏi chính là liệu khoảng cách hiệu suất của Vera Rubin có đủ rộng để biện minh cho sự phụ thuộc vào một nhà cung cấp duy nhất hay không. Các mẫu kỹ thuật Helios và sản xuất khối lượng hạn chế được nhắm mục tiêu cho nửa cuối năm 2026, với sản xuất hàng loạt dự kiến vào quý 2 năm 2027. Cổ phiếu AMD tăng 7,7% vào thứ Ba, trong khi Nvidia tăng 2,6% đóng cửa ở mức 200,09 USD — vẫn thấp hơn 11% so với mức 226 USD khi Barron's chọn cổ phiếu này vào ngày 13 tháng 5.
Cổ phiếu Nvidia đang giao dịch ở mức khoảng 35 lần thu nhập dự phóng, một mức định giá phản ánh vị thế thống trị của công ty trong cơ sở hạ tầng huấn luyện AI. Nếu Vera Rubin không thiết lập được lợi thế hiệu suất mang tính quyết định, hoặc nếu tăng trưởng chi tiêu của các ông lớn siêu quy mô chậm lại, bội số đó có thể phải đối mặt với áp lực thu hẹp. Nửa cuối năm 2026 sẽ xác định liệu lợi thế phần cứng của Nvidia đang mở rộng hay thu hẹp — và liệu sự hoạt động kém hiệu quả của cổ phiếu so với chỉ số bán dẫn là cơ hội mua vào hay là lời cảnh báo.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.