Một báo cáo mới từ SemiAnalysis tiết lộ vòng xoáy giá cả nghiêm trọng trên toàn bộ hạ tầng phần cứng AI, mà không có sự thuyên giảm tức thì nào cho các nhà phát triển đang đối mặt với tình trạng hết công suất.
Giá thuê một năm cho GPU H100 của Nvidia đã tăng gần 40 phần trăm trong vòng chưa đầy sáu tháng lên mức 2,35 USD mỗi giờ, khi nhu cầu bùng nổ từ các phòng thí nghiệm AI và chuỗi cung ứng bị hạn chế tạo ra sự thiếu hụt nghiêm trọng về sức mạnh tính toán.
"Đường cong nhu cầu đang dịch chuyển lên trên và sang phải, tạo ra một lực đẩy mạnh mẽ và tương đối không co giãn làm tăng giá thuê GPU," công ty nghiên cứu SemiAnalysis cho biết trong báo cáo mới nhất của mình.
Giá cho một hợp đồng H100 thời hạn một năm đã nhảy vọt từ mức thấp 1,70 USD/giờ vào tháng 10 năm 2025 lên 2,35 USD vào tháng 3 năm 2026. Nhu cầu này được thúc đẩy bởi doanh thu định kỳ hàng năm (ARR) hàng quý của Anthropic tăng từ 9 tỷ USD lên hơn 25 tỷ USD, theo báo cáo. Về phía cung, SemiAnalysis ước tính giá hợp đồng bộ nhớ DDR5 đã tăng gần gấp 5 lần so với cùng kỳ năm ngoái trong quý đầu tiên của năm 2026.
Sự thắt chặt nguồn cung đang leo thang này có lợi cho những chủ sở hữu phần cứng như Nvidia (NVDA) và các nhà cung cấp đám mây như CoreWeave, những bên giành được quyền lực định giá đáng kể. Ngược lại, nó đe dọa làm thu hẹp biên lợi nhuận và làm chậm quá trình đổi mới của các nhà phát triển AI, những người phải đối mặt với chi phí vận hành tăng vọt và tình trạng hết công suất cho tính toán theo yêu cầu.
Các động lực nhu cầu báo hiệu sự không co giãn về giá
Cốt lõi của sự thiếu hụt bắt nguồn từ một bước nhảy vọt về cấu trúc trong nhu cầu. Sự phát triển của các mô hình như Claude Code của Anthropic và sự gia tăng của các luồng công việc tác nhân AI đa bước đang gây ra sự gia tăng đột biến trong tiêu thụ tài nguyên tính toán. Đồng thời, các vòng gọi vốn khổng lồ cho các phòng thí nghiệm AI như OpenAI và Anthropic trực tiếp chuyển hóa thành việc thu mua GPU quy mô lớn.
Từ góc độ kinh tế, nhu cầu này cho thấy sự không co giãn về giá đáng kể. SemiAnalysis lưu ý rằng với các công cụ AI chứng minh được tỷ suất hoàn vốn từ 5 đến 10 lần, vẫn còn dư địa đáng kể để giá thuê GPU tăng thêm trước khi làm giảm nhu cầu.
Cú sốc nguồn cung lan tỏa từ bộ nhớ đến máy chủ
Hợp lại với sự bùng nổ nhu cầu là những điểm nghẽn nghiêm trọng ở phía cung. Sự tăng tốc mạnh mẽ của việc tăng giá bộ nhớ DRAM và NAND bắt đầu vào tháng 1 năm 2026 đã lan tới các nhà sản xuất máy chủ. Các OEM này đã định giá lại máy chủ AI ở mức vượt xa mức tăng chi phí linh kiện thực tế.
Điều này đã làm giảm lợi nhuận kỳ vọng của một số nhà điều hành đám mây, buộc họ phải trì hoãn hoặc hủy bỏ các đợt triển khai mới và làm thắt chặt hơn nữa thị trường cho thuê. Nguồn cung GPU Blackwell thế hệ tiếp theo của Nvidia cũng bị hạn chế, với việc SemiAnalysis báo cáo rằng thời gian chờ cho các cụm máy chủ mới hiện kéo dài đến giữa năm 2026.
Động lực quyền lực của thị trường đã thay đổi căn bản trong sáu tháng qua. Các nhà cung cấp đám mây mới như CoreWeave, Nebius và IREN hiện đang chiếm ưu thế, yêu cầu mức giá cao hơn và thời hạn hợp đồng dài hơn. Tuy nhiên, báo cáo chỉ ra sự mất kết nối giữa các nền tảng cơ bản mạnh mẽ này và định giá trên thị trường đại chúng của các công ty, vốn vẫn ở gần mức thấp nhất trong năm. SemiAnalysis gợi ý rằng thị trường vẫn đang định giá dựa trên kỳ vọng về tình trạng dư thừa nguồn cung trong tương lai, một kịch bản mâu thuẫn với thực tế khan hiếm và quyền lực định giá hiện tại.
Đối với các nhà đầu tư, công ty đưa ra ba biến số chính sẽ quyết định quỹ đạo giá: khối lượng và thời điểm của các cụm GB300 mới, mức độ nghiêm trọng của tình trạng thiếu hụt silicon cho các linh kiện như bộ nhớ HBM, và sự tăng trưởng tiếp tục của doanh thu các phòng thí nghiệm AI. Cho đến khi các yếu tố này cho thấy một sự thay đổi rõ rệt, báo cáo kết luận rằng hướng đi của giá sức mạnh tính toán có khả năng sẽ tiếp tục đi lên.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.