Tiêu điểm của cuộc chạy đua vũ trang AI đang chuyển dịch từ GPU sang CPU vốn bị bỏ qua từ lâu, khi sự gia tăng của khối lượng công việc AI dạng tác nhân (agentic AI) phức tạp đe dọa làm thay đổi kiến trúc cơ bản của các trung tâm dữ liệu. Tỷ lệ CPU trên GPU được yêu cầu hiện dự kiến sẽ chuyển từ mức 1:4 đến 1:8 sang mức chặt chẽ là 1:1, tạo ra nút thắt cổ chai sản xuất nghiêm trọng cho một thành phần mà trước đây vốn chỉ là yếu tố phụ.
"CPU đang đối mặt với tình trạng thiếu hụt năng suất cực kỳ nghiêm trọng," Dylan Patel, nhà phân tích trưởng tại SemiAnalysis, cho biết trong một cuộc phỏng vấn vào tháng 4. Ông lưu ý rằng mô hình cho khối lượng công việc AI đang phát triển từ việc tạo văn bản đơn giản sang các nhiệm vụ đa bước phức tạp được điều phối bởi các tác nhân AI, một quá trình phụ thuộc rất nhiều vào CPU.
Công ty nghiên cứu thị trường TrendForce đã khẳng định nhận định này trong một báo cáo gần đây, dự báo tỷ lệ CPU trên GPU sẽ thu hẹp xuống còn từ 1:1 đến 1:2 trong kỷ nguyên của AI dạng tác nhân. Trong các khối lượng công việc mới này, CPU xử lý "lớp điều phối" (orchestration layer) — lập kế hoạch nhiệm vụ, gọi các công cụ và quản lý luồng dữ liệu giữa các mô hình. Một bài báo học thuật năm 2025 có tiêu đề "Góc nhìn lấy CPU làm trung tâm về AI dạng tác nhân" đã phát hiện ra rằng việc xử lý công cụ dựa trên CPU có thể chiếm tới 90,6% tổng độ trễ trong các tác vụ tác nhân. Arm tính toán rằng điều này có nghĩa là nhu cầu tăng gấp bốn lần, từ 30 triệu lõi CPU mỗi gigawatt trong các trung tâm dữ liệu AI truyền thống lên 120 triệu lõi cho AI dạng tác nhân.
Cú sốc nhu cầu mang tính cấu trúc này đang định hình lại bối cảnh cạnh tranh, gây áp lực to lớn lên sự thống trị lịch sử của Intel trong khi tạo ra cơ hội tăng trưởng lớn cho AMD và các đối thủ mới gia nhập như Nvidia và Arm. Đối với các nhà đầu tư, điều này mở ra các hướng đi mới để tận dụng việc xây dựng cơ sở hạ tầng AI bên ngoài giao dịch GPU đã quá quen thuộc.
Sự dịch chuyển này lần đầu tiên gây bất ổn cho thị trường x86 truyền thống. Intel, công ty có bộ vi xử lý Xeon nắm giữ hơn 95% thị trường máy chủ, đã chứng kiến vị thế của mình bị xói mòn sau khi các vấn đề về sản lượng quy trình 7nm làm trì hoãn chip Sapphire Rapids gần hai năm, mở cửa cho EPYC Milan của AMD. Lộ trình năm 2026 của Intel, bao gồm Xeon 6+ 288 lõi và Xeon 7 256 lõi, phụ thuộc vào nút quy trình 18A vẫn chưa được chứng minh của họ. TrendForce báo cáo rằng các vấn đề về sản lượng có thể làm trì hoãn việc sản xuất hàng loạt các chip này sang năm 2027, có khả năng cho phép AMD tiếp tục giành thị phần với EPYC Venice 256 lõi/512 luồng, được xây dựng trên quy trình N2 của TSMC.
Thay đổi đáng kể hơn là sự gia nhập của các bên chơi không truyền thống. Vào tháng 3 năm 2026, gã khổng lồ GPU Nvidia thông báo sẽ bán CPU Vera của mình dưới dạng một sản phẩm độc lập. Con chip này, dựa trên quy trình N3 của TSMC, có 88 lõi và có thể được liên kết trực tiếp với các GPU của Nvidia thông qua kết nối NVLink-C2C. Cùng tháng đó, Arm đã chấm dứt lịch sử 35 năm là một công ty chỉ cấp phép IP bằng cách công bố CPU của riêng mình, Arm AGI. Con chip 136 lõi, cũng dựa trên quy trình N3 của TSMC, đã giành được các hợp đồng thiết kế với Meta, OpenAI và Microsoft. Các nhà cung cấp dịch vụ đám mây cũng đang đẩy nhanh các thiết kế CPU nội bộ của họ, với Graviton5 của AWS, Cobalt 200 của Microsoft và Axion của Google đều nhắm đến việc cắt giảm chi phí cho khối lượng công việc AI.
Sự gia tăng nhu cầu CPU tạo ra một hướng đầu tư mới, vốn chưa được đánh giá đúng mức bên ngoài GPU. Trong khi Intel (INTC) đối mặt với rủi ro thực thi đáng kể trên quy trình 18A của mình, AMD (AMD) có vị thế để tiếp tục giành thị phần. Sự gia nhập của Nvidia (NVDA) và Arm (ARM) mở ra các dòng doanh thu mới trị giá hàng tỷ đô la cho cả hai công ty. Việc mở rộng các nhà thiết kế CPU không truyền thống này cũng trực tiếp mang lại lợi ích cho các công ty dịch vụ backend IC như Global Unichip Corp. (GUC), đơn vị xử lý thiết kế cho Google và Microsoft, và hệ sinh thái đóng gói tiên tiến rộng lớn hơn của TSMC.
Bài viết này chỉ nhằm mục đích thông tin và không cấu thành lời khuyên đầu tư.