Uber đang thắt chặt sự phụ thuộc vào silicon tùy chỉnh của Amazon, mở rộng việc sử dụng bộ xử lý AWS Graviton và trở thành công ty công nghệ lớn mới nhất thử nghiệm bộ tăng tốc AI Trainium3, một đối thủ cạnh tranh trực tiếp với các chip thống trị của Nvidia.
"Việc chuyển các khối lượng công việc cốt lõi sang Graviton đã cắt giảm 15% chi phí tính toán của chúng tôi," một trưởng nhóm kỹ thuật của Uber cho biết. "Thử nghiệm Trainium3 là bước tiếp theo để tối ưu hóa các mô hình học máy của chúng tôi về cả chi phí và hiệu suất."
Thỏa thuận được công bố vào ngày 7 tháng 4 sẽ chứng kiến việc Uber chuyển thêm nhiều dịch vụ chia sẻ xe và hậu cần cốt lõi của mình sang các CPU Graviton dựa trên ARM. Mặc dù Amazon chưa tiết lộ thông số kỹ thuật đầy đủ của Trainium3, họ khẳng định con chip này mang lại hiệu quả về chi phí-hiệu suất tốt hơn tới 40% so với các GPU Nvidia tương đương để đào tạo các mô hình ngôn ngữ lớn.
Sự áp dụng bởi một người dùng có khối lượng lớn như Uber là một sự chứng thực đáng kể cho chiến lược chip trị giá hàng tỷ đô la của Amazon (AMZN) và là một mối đe dọa cạnh tranh ngày càng tăng đối với 80% thị phần của Nvidia (NVDA) trong các trung tâm dữ liệu AI. Đối với Uber (UBER), nó đại diện cho một kế hoạch dài hạn nhằm giảm sự phụ thuộc vào nhà cung cấp công nghệ và kiểm soát chi phí cơ sở hạ tầng.
Sự mở rộng chiến lược này được thúc đẩy bởi chi phí tính toán khổng lồ liên quan đến việc đào tạo và vận hành các mô hình AI, những yếu tố không thể thiếu đối với các thuật toán định giá, định tuyến và điều động của Uber. Bằng cách sử dụng các con chip được thiết kế tùy chỉnh của Amazon, Uber đặt mục tiêu tạo ra một cơ cấu hạ tầng tiết kiệm chi phí và tiết kiệm điện năng hơn, giảm bớt sự phụ thuộc vào phần cứng đa dụng đắt tiền hơn từ các nhà cung cấp bên thứ ba như Nvidia và Intel.
Việc Amazon thúc đẩy silicon tùy chỉnh phản ánh nỗ lực của Google và Microsoft nhằm kiểm soát vận mệnh phần cứng của chính họ và giảm chi tiêu vận hành. Trong khi GPU H100 và B200 sắp tới của Nvidia vẫn là tiêu chuẩn ngành cho đào tạo AI hiệu suất cao, sự trỗi dậy của các lựa chọn thay thế nội bộ "đủ dùng" và tiết kiệm chi phí hơn như Trainium cho suy luận và các khối lượng công việc đào tạo cụ thể là một câu chuyện đang phát triển. Xu hướng này đe dọa làm xói mòn vị thế gần như độc quyền của Nvidia đối với phần cứng AI.
Đối với các nhà đầu tư, điều này báo hiệu rằng thị trường chip AI không phải là một kịch bản kẻ thắng được tất cả. Khả năng của Amazon trong việc giành được khối lượng công việc từ một khách hàng lớn như Uber mang lại uy tín cho tham vọng chip của họ, có khả năng thúc đẩy câu chuyện tăng trưởng của AWS. Mặc dù không phải là mối đe dọa ngay lập tức đối với doanh thu của Nvidia, vốn được đảm bảo bởi lượng đơn đặt hàng tồn đọng khổng lồ, nó làm nổi bật một rủi ro dài hạn. Các nhà phân tích của Morgan Stanley đã lưu ý rằng việc các doanh nghiệp áp dụng các chip AI thay thế có thể kìm hãm bội số định giá của Nvidia, vốn hiện đang giao dịch ở mức trên 70 lần lợi nhuận lũy kế.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.