Big Tech rút lui khỏi cuộc đua token AI khi hóa đơn 500 triệu USD chất chồng

Amazon, Meta, Microsoft và Uber đều đã rút lui khỏi các chỉ số tiêu thụ token AI nội bộ trong những tuần gần đây, sau khi nhân viên đốt cháy số tiền điện toán trị giá hàng tỷ đô la với rất ít kết quả kinh doanh có thể đo lường được, đánh dấu sự điều chỉnh chi tiêu AI doanh nghiệp đáng kể nhất kể từ khi công nghệ này trở nên phổ biến.

"Xin đừng sử dụng AI chỉ vì muốn sử dụng AI," Dave Treadwell, phó chủ tịch cấp cao mảng kỹ thuật của Amazon, nói với nhân viên trong tuần này. "Hãy sử dụng AI để giúp bạn giải quyết vấn đề của khách hàng, giúp bạn giải quyết vấn đề kinh doanh, để đổi mới."

Amazon đã đóng cửa KiroRank, một bảng xếp hạng nội bộ theo dõi mức sử dụng token AI trên nền tảng Kiro dành cho nhà phát triển, vào ngày 29/5, theo Business Insider. Bảng điều khiển này đã khuyến khích nhân viên thổi phồng điểm số của họ thông qua "tokenmaxxing" — chạy các tác vụ vô nghĩa thông qua các tác nhân AI để tiêu thụ token và leo bảng xếp hạng. Một người phát ngôn của Amazon xác nhận công cụ này đã bị "ngừng sử dụng" và cho biết nó "không bao giờ được thiết kế để khuyến khích việc sử dụng AI chỉ vì mục đích sử dụng."

Sự rút lui này không phải cá biệt. Meta cũng đã loại bỏ bảng xếp hạng sử dụng AI nội bộ của riêng mình, có tên là Claudenomics, trong cùng tuần. Bảng điều khiển đó đã theo dõi mức tiêu thụ token trên 85.000 nhân viên và chọn ra 250 người dùng hàng đầu, theo Fortune. Giám đốc vận hành của Uber, Andrew Macdonald, gần đây cho biết công ty không tìm thấy mối quan hệ rõ ràng nào giữa chi tiêu AI gia tăng và việc ra mắt sản phẩm thành công — sau khi các kỹ sư của họ đã sử dụng hết ngân sách Claude Code cho cả năm vào tháng Tư. Microsoft đã hủy giấy phép Claude Code trên toàn bộ bộ phận Experiences and Devices vào đầu tháng này, chuyển hướng các kỹ sư sang GitHub Copilot CLI nội bộ của mình.

Chi phí của việc coi token như một thước đo năng suất

Token là đơn vị mà các mô hình ngôn ngữ lớn sử dụng để xử lý văn bản và tạo phản hồi. Theo định giá dựa trên token, chi phí tăng theo mức sử dụng chứ không phải kết quả. Khi các công ty khuyến khích tiêu thụ mà không đo lường kết quả, họ đã tạo ra một hệ thống nơi việc thổi phồng các con số là hợp lý đối với cá nhân nhưng lại mang tính hủy hoại đối với ngân sách.

Một công ty giấu tên đã vô tình chi 500 triệu đô la chỉ trong một tháng cho Claude của Anthropic sau khi không đặt giới hạn sử dụng, theo Axios. Khách hàng đơn lẻ đó chiếm khoảng 1/8 doanh thu thuần hàng năm ước tính 4,7 tỷ đô la của Anthropic. Công ty này vẫn chưa được xác định công khai, mặc dù các đồn đoán trên mạng xã hội tập trung vào Amazon, công ty đang chi khoảng 200 tỷ đô la chi tiêu vốn vào năm 2026, chủ yếu cho AI và các trung tâm dữ liệu.

Amazon đã đặt mục tiêu hơn 80% nhà phát triển của mình sử dụng các công cụ AI hàng tuần, theo Fortune. Công ty hiện đã thay thế số lượng token thô bằng một chỉ số có tên "normalized deployments" (triển khai chuẩn hóa), đo lường mã code có sự hỗ trợ của AI thực sự được đưa vào vận hành thay vì số token tiêu thụ.

Giám đốc điều hành Duolingo, Luis von Ahn, gần đây đã thừa nhận sự xung đột nội bộ tương tự. "Chúng tôi không bị yêu cầu giải trình về kết quả thực tế," ông nói trên một podcast vào tháng Tư, sau khi công ty rút lại kế hoạch gắn việc sử dụng AI với đánh giá hiệu suất của nhân viên.

Điều này có ý nghĩa gì đối với chi tiêu hạ tầng AI

Sự rút lui này không báo hiệu sự thoái lui khỏi đầu tư AI. Cam kết chi tiêu vốn 200 tỷ đô la của Amazon vẫn được giữ nguyên. Google đã công bố tại hội nghị I/O của mình rằng mức sử dụng Gemini đã tăng từ 480 nghìn tỷ token mỗi tháng vào tháng 5/2025 lên 3,2 triệu tỷ token mỗi tháng vào tháng 5/2026, được thúc đẩy phần lớn bởi AI tác nhân và các công cụ lập trình đốt cháy nhiều năng lượng tính toán hơn nhiều so với các truy vấn chatbot cơ bản.

Nhưng sự chuyển đổi từ các chỉ số dựa trên mức tiêu thụ sang dựa trên kết quả thể hiện một sự thay đổi đáng kể trong cách đo lường giá trị AI doanh nghiệp. Các công ty bán công cụ AI trên cơ sở từng token — bao gồm Anthropic và ở mức độ thấp hơn là OpenAI — đang phải đối mặt với áp lực ngày càng lớn trong việc chứng minh lợi tức đầu tư khi khách hàng thắt chặt ngân sách. Các nhà cung cấp công cụ nội bộ như GitHub Copilot của Microsoft sẽ được hưởng lợi khi các công ty chuyển hướng chi tiêu sang các nền tảng tích hợp.

DeepSeek, phòng thí nghiệm AI của Trung Quốc, đã lưu ý trong báo cáo kỹ thuật V4 của mình rằng mô hình của họ hiện vượt trội hơn Claude Sonnet 4.5 nội bộ trong khi chi phí thấp hơn — một lời nhắc nhở rằng giai đoạn tiếp theo của cuộc cạnh tranh AI doanh nghiệp sẽ được định nghĩa bởi hiệu quả, chứ không phải tiêu thụ thô.

Đối với các nhà đầu tư, thông điệp rất tinh tế. Nvidia, công ty có GPU cung cấp sức mạnh cho phần lớn khối lượng công việc huấn luyện và suy luận AI, là bên hưởng lợi chính từ cuộc chạy đua token. Nếu các khách hàng doanh nghiệp bắt đầu tối ưu hóa cho ít token hơn trên mỗi tác vụ thay vì nhiều hơn, đường cong tăng trưởng nhu cầu về năng lực tính toán AI có thể đi ngang. Cổ phiếu Nvidia đang giao dịch ở mức khoảng 35 lần thu nhập dự kiến, định giá mức tăng trưởng theo cấp số nhân liên tục trong doanh thu trung tâm dữ liệu.

"Các công ty vẫn đang tìm cách giải quyết," Will McGough, giám đốc đầu tư chính tại Prime Capital Financial, nói với Wall Street Journal. Sự điều chỉnh từ 'sử dụng nhiều AI hơn' sang 'sử dụng AI có hiệu quả' chỉ mới bắt đầu.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.