Một cuộc khủng hoảng nguồn cung cấu trúc đang lan rộng khắp Thung lũng Silicon khi các gã khổng lồ đám mây như Microsoft và Amazon ưu tiên các bộ phận AI của riêng họ và các khách hàng cấp cao cho các GPU đáng thèm muốn của Nvidia Corp., khiến các startup do vốn mạo hiểm hỗ trợ phải đối mặt với giá cả leo thang và thời gian chờ đợi kéo dài hàng năm. Sự thắt chặt này đe dọa làm đình trệ sự đổi mới và củng cố quyền lực AI, khi quyền truy cập vào phần cứng máy tính thiết yếu trở thành một hàm số của bảng cân đối kế toán của một startup thay vì công nghệ của nó.
"Chúng tôi nghe nhiều người nói rằng tính toán—cụ thể là truy cập GPU—là một trong những nút thắt lớn nhất trong năm nay," Hemant Taneja, đối tác quản lý tại General Catalyst, đã viết trong một cuộc khảo sát gửi tới các nhà sáng lập danh mục đầu tư của công ty mình. Ý kiến này đã được các nhà sáng lập startup lặp lại, những người đã thấy giá thuê các chip thiết yếu tăng hơn 30% chỉ trong sáu tháng, với các hợp đồng dài hạn trở thành cách duy nhất để đảm bảo năng lực.
Sự thắt chặt nguồn cung đã trực tiếp chuyển thành chi phí cao hơn và sự không chắc chắn trong vận hành cho các đơn vị nhỏ hơn. Startup tạo hình ảnh Krea, đã huy động được 83 triệu USD từ các nhà đầu tư bao gồm Andreessen Horowitz, đã thấy giá hợp đồng cho GPU Nvidia Blackwell tăng vọt 32% lên 3,70 USD mỗi giờ cho mỗi chip chỉ trong sáu tháng. Trong khi đó, đơn vị đám mây Azure của Microsoft đã triển khai một hệ thống phân tầng chính thức, trong đó 1.000 khách hàng hàng đầu được ưu tiên truy cập, trong khi các công ty nhỏ hơn ở "Tầng 3" phải đối mặt với sự chờ đợi kéo dài đến cuối năm 2026 và các chính sách thu hồi quyền truy cập vào các máy chủ nhàn rỗi.
Nút thắt cổ chai không chỉ là về giá cả, mà là về tính sẵn có. Một nhà sáng lập đang tìm kiếm một cụm gần 1.000 GPU—một cấu hình sẽ tốn hơn 70.000 USD mỗi ngày để thuê—đã được nhân viên bán hàng của Nvidia cho biết rằng việc tìm kiếm một cụm như vậy tại một nhà cung cấp đám mây lớn là cực kỳ khó khăn. Sự khan hiếm này đang thúc đẩy một số bên, như startup đại lý AI Collide, cân nhắc một bước chuyển hướng thâm dụng vốn: chi khoảng 500.000 USD để mua và vận hành các GPU của riêng mình, một động thái đánh đổi chi phí trả trước cao hơn để lấy sự chắc chắn về nguồn cung.
Hệ Thống Cấp Bậc Tính Toán Mới
Chiến lược phân bổ nội bộ của Microsoft tiết lộ một thứ tự ưu tiên rõ ràng. Một nhân viên am hiểu vấn đề này tiết lộ rằng Azure chia khách hàng thành ba tầng. Tầng 1 bao gồm khoảng 1.000 khách hàng chi tiêu hàng đầu có quyền truy cập ưu tiên. Để đủ điều kiện nhận chip Blackwell mới nhất của Nvidia, khách hàng hiện phải cam kết mua ít nhất 1.000 chip trong tối thiểu một năm, một hợp đồng trị giá hàng chục triệu đô la.
Động lực này có lợi cho các nhà cung cấp đám mây, những người có biên lợi nhuận cho thuê GPU đang được cải thiện sau một thời gian chịu áp lực. Tuy nhiên, nó tạo ra một môi trường đầy thách thức cho hệ sinh thái AI rộng lớn hơn. Tình hình này phản ánh sự thiếu hụt năm 2023, nhưng hiện đang gia tăng do nhu cầu bùng nổ đối với các trợ lý lập trình AI và việc hết hạn của các hợp đồng đám mây cũ, rẻ hơn. Các công ty đầu tư mạo hiểm như Andreessen Horowitz và Index Ventures, những đơn vị trước đây đã xây dựng các nhóm GPU của riêng mình để hỗ trợ các startup của họ, đang thấy lịch sử lặp lại, nhưng với rủi ro cao hơn.
Bỏ Qua Đám Mây
Sự cạnh tranh gay gắt đối với GPU dựa trên đám mây đang buộc các startup được tài trợ tốt phải đánh giá lại chiến lược. Collin McLelland, nhà sáng lập startup đại lý AI Collide, đơn vị đã huy động được vòng hạt giống trị giá 14 triệu USD, đang cân nhắc việc mua GPU để tránh sự không chắc chắn của thị trường cho thuê. "Rủi ro lớn nhất đối với chúng tôi là không có tính toán khi chúng tôi cần," McLelland nói. Mặc dù chi phí trả trước là đáng kể, ông xem đó là một khoản đầu tư dài hạn mang lại sự bảo vệ khỏi những ý muốn bất chợt trong việc phân bổ của nhà cung cấp đám mây.
Xu hướng này, nếu tăng tốc, có thể báo hiệu một sự thay đổi một phần khỏi mô hình tập trung vào đám mây đã thống trị thập kỷ qua của hạ tầng công nghệ. Mặc dù chỉ khả thi đối với một nhóm nhỏ các startup, động thái chuyển sang phần cứng tự quản lý nhấn mạnh mức độ nghiêm trọng của các hạn chế nguồn cung hiện tại. Đối với các nhà cung cấp đám mây, sự gia tăng lợi nhuận ngắn hạn từ việc cho thuê GPU giá cao có thể phải trả giá bằng chi phí dài hạn là đẩy những khách hàng sáng tạo nhất của họ về phía độc lập.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.