Cặp giao dịch trị giá 20 tỷ USD của OpenAI và Nvidia đã châm ngòi cho một cuộc chiến vì tương lai của tính toán AI, chuyển chiến trường từ đào tạo mô hình sang thị trường suy luận lớn hơn nhiều.
Quay lại
Cặp giao dịch trị giá 20 tỷ USD của OpenAI và Nvidia đã châm ngòi cho một cuộc chiến vì tương lai của tính toán AI, chuyển chiến trường từ đào tạo mô hình sang thị trường suy luận lớn hơn nhiều.

Một cuộc chiến chiến lược cho giai đoạn tiếp theo của trí tuệ nhân tạo đang leo thang, với việc OpenAI và Nvidia cùng cam kết chi hơn 40 tỷ USD để đảm bảo vị thế thống trị trong suy luận AI — quá trình sử dụng một mô hình đã được đào tạo để tạo ra phản hồi. Các động thái này đe dọa sẽ làm đảo lộn một thị trường mà Nvidia đã một tay kiểm soát và báo hiệu một sự thay đổi kiến trúc lớn trong ngành bán dẫn.
Những phát súng mở màn của cuộc xung đột đã được bắn vào tháng 12 năm 2025 với việc Nvidia âm thầm mua lại Groq, một công ty khởi nghiệp chuyên về chip suy luận tốc độ cao, với giá 20 tỷ USD. Đòn phản công diễn ra vào ngày 17 tháng 4 năm 2026, khi các báo cáo tiết lộ OpenAI sẽ chi hơn 20 tỷ USD cho các con chip từ đối thủ khởi nghiệp Cerebras Systems, nắm giữ tới 10% cổ phần của công ty này. Cerebras đã nộp đơn xin IPO trị giá 35 tỷ USD cùng ngày.
Hai thỏa thuận này làm nổi bật sự tái cân bằng cơ bản trong ngành công nghiệp AI. Trong khi việc đào tạo các mô hình lớn như GPT-4 rất tốn kém về mặt tính toán, thì đó là chi phí một lần. Suy luận, xảy ra mỗi khi người dùng đặt câu hỏi, đại diện cho một chi phí liên tục và cuối cùng là lớn hơn. Theo nghiên cứu thị trường từ CES 2026, suy luận dự kiến sẽ chiếm 2/3 tổng chi tiêu cho tính toán AI vào năm 2026, một con số mà một số giám đốc điều hành tin rằng có thể đạt tới 80%.
"Trọng tâm của ngành công nghiệp AI đang nhanh chóng chuyển dịch từ các đợt đào tạo một lần sang hàng tỷ yêu cầu suy luận hàng ngày," một nhà phân tích công nghệ lưu ý. "Đây không chỉ là một thị trường lớn hơn; đó là một thị trường khác biệt về mặt kỹ thuật, và sự thống trị của Nvidia ở đây không còn được đảm bảo nữa."
### Một sự chia rẽ về kiến trúc mở ra
Cốt lõi của cuộc xung đột nằm ở thiết kế chip. Các GPU của Nvidia, chẳng hạn như H100, được tối ưu hóa cho các tính toán song song khổng lồ cần thiết cho việc đào tạo. Tuy nhiên, sự phụ thuộc của chúng vào bộ nhớ băng thông cao (HBM) bên ngoài tạo ra một nút thắt cổ chai cho suy luận, nơi tốc độ truy xuất trọng số mô hình từ bộ nhớ là yếu tố hạn chế chính.
Cerebras và Groq đã theo đuổi một con đường khác. Các con chip của họ — tương ứng là Wafer Scale Engine (WSE) và Language Processing Unit (LPU) — tích hợp một lượng lớn SRAM siêu nhanh trực tiếp lên silicon cùng với các lõi xử lý. Thiết kế này giúp giảm đáng kể độ trễ bộ nhớ, cho phép tốc độ suy luận được báo cáo là nhanh hơn 15 đến 20 lần so với các sản phẩm hiện tại của Nvidia cho một số tác vụ nhất định.
Việc Nvidia mua lại Groq với giá 20 tỷ USD là một sự thừa nhận ngầm về lỗ hổng kiến trúc này. Thay vì chỉ dựa vào lộ trình sản phẩm của riêng mình, như Blackwell B200 mới giúp tăng cường hiệu suất suy luận, công ty đã trả một mức giá cao để thâu tóm một công nghệ cạnh tranh. Đối với nhà bán chip AI lớn nhất thế giới, đó là một động thái phòng thủ để lấp đầy một lỗ hổng tiềm năng trong danh mục đầu tư của mình.
### Thế trận tấn công của OpenAI
Ngược lại, thỏa thuận của OpenAI là một chiến lược tấn công rõ ràng. Nhà cung cấp mô hình AI lớn nhất thế giới không chỉ đa dạng hóa các nhà cung cấp của mình; họ đang tích cực nuôi dưỡng một đối thủ cho Nvidia. Thỏa thuận bao gồm hơn 20 tỷ USD mua sắm chip, chứng quyền cho tối đa 10% cổ phần tại Cerebras và khoản đầu tư 1 tỷ USD để giúp xây dựng các trung tâm dữ liệu cần thiết để chứa phần cứng mới.
Động thái này phản ánh chiến lược lịch sử của Apple là tích hợp sâu sắc và cuối cùng là kiểm soát chuỗi cung ứng chip của mình. Bằng cách đảm bảo một nhà cung cấp suy luận hiệu suất cao chuyên dụng, OpenAI giảm bớt sự phụ thuộc vào Nvidia và giành được lợi thế đối với chi phí vận hành các mô hình của mình ở quy mô lớn. Công ty cũng được cho là đang phát triển các chip ASIC tùy chỉnh của riêng mình với đối tác Broadcom, báo hiệu một sự thúc đẩy đa diện cho sự độc lập về tính toán.
Đối với các nhà đầu tư, đợt IPO của Cerebras đưa ra một bức tranh phức tạp. Công ty, sẽ giao dịch dưới mã chứng khoán "CBRS", hiện đang nhắm tới mức định giá 35 tỷ USD, một bước nhảy vọt so với mức định giá 23 tỷ USD vào tháng 2 năm 2026 và mức định giá 8,1 tỷ USD vào tháng 9 năm 2025. Nỗ lực IPO lần thứ hai này diễn ra sau khi hồ sơ năm 2024 bị rút lại do các lo ngại về an ninh quốc gia đối với khách hàng lớn nhất lúc bấy giờ của họ, quỹ G42 có trụ sở tại UAE.
Mặc dù việc thay thế G42 bằng OpenAI làm khách hàng mỏ neo giúp cải thiện chất lượng doanh thu, nhưng nó không giải quyết được vấn đề cơ bản về sự tập trung khách hàng. Các nhà đầu tư trong đợt IPO đang đặt cược rằng nhu cầu của OpenAI sẽ được duy trì và Cerebras có thể đa dạng hóa thành công cơ sở khách hàng của mình trước khi các con chip nội bộ của OpenAI trở thành một giải pháp thay thế khả thi. Câu hỏi trị giá 35 tỷ USD là liệu sự lạc quan đó đã được phản ánh vào giá hay chưa.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.