Thỏa thuận trị giá hàng tỷ đô la của Meta để áp dụng CPU Graviton5 tùy chỉnh của Amazon đánh dấu một bước chuyển mình lớn trong việc xây dựng cơ sở hạ tầng cho AI tác nhân, thách thức sự thống trị của các nhà sản xuất chip truyền thống.
Quay lại
Thỏa thuận trị giá hàng tỷ đô la của Meta để áp dụng CPU Graviton5 tùy chỉnh của Amazon đánh dấu một bước chuyển mình lớn trong việc xây dựng cơ sở hạ tầng cho AI tác nhân, thách thức sự thống trị của các nhà sản xuất chip truyền thống.

Meta Platforms sẽ triển khai hàng chục triệu bộ xử lý Graviton5 của Amazon Web Services trong một thỏa thuận kéo dài nhiều năm, trị giá hàng tỷ đô la, báo hiệu một sự thay đổi chiến lược trong cách các công ty công nghệ lớn đang xây dựng cơ sở hạ tầng cho trí tuệ nhân tạo thế hệ mới. Thỏa thuận này mở rộng mối quan hệ hợp tác lâu dài và đưa Meta trở thành một trong những khách hàng sử dụng Graviton lớn nhất thế giới.
“Khi chúng tôi mở rộng quy mô cơ sở hạ tầng đằng sau các tham vọng AI của Meta, việc đa dạng hóa các nguồn tính toán là một mệnh lệnh chiến lược,” Santosh Janardhan, giám đốc cơ sở hạ tầng tại Meta cho biết. “Việc mở rộng sang Graviton cho phép chúng tôi chạy các khối lượng công việc thâm dụng CPU đằng sau AI tác nhân với hiệu suất và hiệu quả mà chúng tôi cần ở quy mô của mình.”
Thỏa thuận bắt đầu với hàng chục triệu lõi Graviton5 và cung cấp sự linh hoạt để mở rộng. Các chip này được thiết kế cho các tác vụ thâm dụng CPU là trung tâm của AI tác nhân, chẳng hạn như lập luận thời gian thực, tạo mã và điều phối các quy trình làm việc đa bước phức tạp. Mặc dù GPU vẫn quan trọng để huấn luyện các mô hình lớn, động thái này làm nổi bật tầm quan trọng ngày càng tăng của các CPU chuyên dụng cho suy luận quy mô lớn và các hệ thống dựa trên tác nhân.
Thỏa thuận này đại diện cho một sự khẳng định đáng kể về khoản đầu tư thập kỷ của AWS vào silicon tùy chỉnh và đặt ra thách thức trực tiếp đối với các nhà cung cấp CPU truyền thống như Intel và Advanced Micro Devices. Khi các nhà cung cấp dịch vụ đám mây quy mô lớn như Meta tìm cách tối ưu hóa hiệu suất và chi phí cho các khối lượng công việc cụ thể của họ, xu hướng chuyển từ các bộ xử lý có sẵn sang các chip được xây dựng chuyên dụng đang gia tăng, tạo ra áp lực mới lên mảng kinh doanh trung tâm dữ liệu của các công ty đương nhiệm.
Sự trỗi dậy của các hệ thống AI tác nhân — có thể lập luận, lập kế hoạch và thực hiện các nhiệm vụ một cách tự chủ — đang tạo ra nhu cầu lớn về các CPU hiệu suất cao, tiết kiệm năng lượng. Việc triển khai quy mô lớn Graviton5 của Meta là phản ứng trực tiếp cho xu hướng này. Chip AWS Graviton5, được xây dựng trên công nghệ 3 nanomet, sở hữu 192 lõi và bộ nhớ đệm lớn gấp năm lần so với phiên bản tiền nhiệm, giúp giảm độ trễ giao tiếp giữa các lõi lên đến 33%.
Các thông số kỹ thuật này cung cấp sức mạnh xử lý và băng thông cần thiết cho các phép tính phức tạp, liên tục theo yêu cầu của các tham vọng AI của Meta. Các chip này sẽ được hỗ trợ bởi Hệ thống AWS Nitro, cung cấp khả năng truy cập bare-metal và mạng hiệu suất cao thông qua Elastic Fabric Adapter (EFA), cho phép giao tiếp độ trễ thấp thiết yếu cho các khối lượng công việc AI phân tán.
“Mối quan hệ hợp tác mở rộng của Meta, triển khai hàng chục triệu lõi Graviton, cho thấy điều gì sẽ xảy ra khi bạn kết hợp silicon chuyên dụng với toàn bộ hệ sinh thái AI của AWS để cung cấp sức mạnh cho thế hệ AI tác nhân tiếp theo,” Nafea Bshara, phó chủ tịch kiêm kỹ sư xuất sắc tại Amazon cho biết.
Quyết định cam kết với Graviton ở quy mô lớn của Meta nhấn mạnh một sự chuyển đổi rộng lớn hơn trong ngành. Trong nhiều năm, các trung tâm dữ liệu bị thống trị bởi kiến trúc x86 từ Intel và AMD. Giờ đây, các nhà cung cấp đám mây đang ngày càng tự thiết kế các chip dựa trên Arm của riêng họ để đạt được các lợi thế về hiệu suất, hiệu quả và chi phí. Thỏa thuận này là một chiến thắng lớn cho nỗ lực sản xuất chip của AWS và là một khoản tổn thất tiềm tàng hàng tỷ đô la trong thị trường có thể tiếp cận đối với các đối thủ của họ.
Động thái này cũng phản ánh một cách tiếp cận đa dạng hơn đối với cơ sở hạ tầng AI. Trong khi Nvidia vẫn là nhà lãnh đạo không thể bàn cãi về GPU cho huấn luyện AI, thị trường suy luận đang trở nên phân mảnh hơn. Bằng cách sử dụng Graviton5 cho các tác vụ suy luận thâm dụng CPU, Meta có thể tối ưu hóa chồng cơ sở hạ tầng của mình, phân bổ đúng bộ xử lý cho đúng công việc. Cách tiếp cận hỗn hợp này cho phép Meta theo đuổi các mục tiêu AI của mình trong khi vẫn quản lý được chi phí và cải thiện hiệu quả năng lượng, phù hợp với các mục tiêu bền vững của mình. Graviton5 mang lại hiệu suất tốt hơn tới 25% so với thế hệ trước, một yếu tố then chốt cho các công ty hoạt động ở quy mô toàn cầu.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.