Khách hàng OpenAI đốt 100 tỷ token mỗi tháng khi chi phí tăng vọt

Chi tiêu AI doanh nghiệp đã chuyển từ một ý nghĩ phụ thành một cuộc khủng hoảng ngân sách chỉ trong sáu tháng, CEO OpenAI Sam Altman thừa nhận.

Chi phí vận hành trí tuệ nhân tạo đã trở thành một "vấn đề lớn" đối với khách hàng doanh nghiệp, CEO OpenAI Sam Altman cho biết, khi mức tiêu thụ token tăng vọt 1 triệu lần so với chỉ sáu năm trước.

"Chi phí chưa bao giờ được đề cập đến sáu tháng trước," Altman nói tại một sự kiện doanh nghiệp của OpenAI vào ngày 2 tháng 6. "Giờ đây nó là một vấn đề lớn." CEO này tiết lộ rằng khách hàng lớn nhất hiện tại của OpenAI tiêu thụ khoảng 100 tỷ token mỗi tháng — tương đương khoảng 75 tỷ từ — so với 100.000 token của người dùng hàng đầu cách đây sáu năm rưỡi.

Sự bùng nổ trong mức sử dụng đã phơi bày một vấn đề cấu trúc: OpenAI chi 1,35 đô la cho mỗi 1 đô la doanh thu, với các khoản lỗ được thúc đẩy chủ yếu bởi chi phí suy luận chứ không phải đào tạo mô hình. Uber Technologies Inc. đã cạn kiệt toàn bộ ngân sách AI năm 2026 trong bốn tháng đầu năm, buộc phải áp dụng hạn mức token cứng, trong khi các kỹ sư riêng lẻ tại công ty gọi xe này phải chịu hóa đơn AI hàng tháng từ 150 đến 2.000 đô la. Amazon.com Inc. đã đóng cửa bảng xếp hạng token nội bộ để ngăn chặn việc tiêu thụ mất kiểm soát.

Việc chuyển đổi sang thanh toán dựa trên token của OpenAI và Anthropic trong quý đầu năm 2026 đã biến một khoản chi phí mờ đục trước đây thành một chi phí có thể đo lường được cho từng tác vụ — và những kết quả ban đầu đang làm các đội ngũ tài chính doanh nghiệp lo ngại. Gartner dự báo chi tiêu cho phần mềm AI agent sẽ đạt 207 tỷ đô la trong năm 2026, tăng 139% so với năm 2025, nhưng quỹ đạo đó giả định các doanh nghiệp tiếp tục mở rộng chi tiêu AI. Tín hiệu từ Uber, cùng với xu hướng các công ty âm thầm cắt giảm tiêu thụ token, cho thấy quỹ đạo này đang chịu áp lực.

Bẫy Token

Gốc rễ của cuộc khủng hoảng chi phí nằm ở cấu trúc định giá của ngành. Trong phần lớn kỷ nguyên AI tạo sinh, các gói đăng ký phí cố định đã hấp thụ việc đốt token không giới hạn, khiến chi phí thực tế của bất kỳ tác vụ nào trở nên vô hình. Khi Anthropic và OpenAI chuyển khách hàng doanh nghiệp sang thanh toán dựa trên mức sử dụng trong quý 1 năm 2026, các chi phí ẩn bỗng nhiên trở nên rõ ràng. Một khách hàng doanh nghiệp của Anthropic đã vô tình chi 500 triệu đô la trong một tháng sau khi không thiết lập giới hạn chi tiêu.

Vấn đề có hai lớp. Thứ nhất, chất lượng đầu ra vẫn khó dự đoán — các mô hình ngôn ngữ lớn bị ảo giác, lặp vòng và thất bại theo những cách khó lường trước, và mọi lần chạy thất bại đều tiêu tốn token bất kể kết quả ra sao. Thứ hai, không có đơn vị tiêu chuẩn nào để đo lường chi phí của một tác vụ AI, bởi vì cùng một tác vụ có thể tiêu thụ số lượng token khác nhau rất lớn tùy thuộc vào prompt, phiên bản mô hình, cửa sổ ngữ cảnh và liệu agent có đi sai hướng hay không.

Việc GitHub Copilot chuyển sang thanh toán dựa trên token vào tháng 6 năm 2026 đã cung cấp bằng chứng rõ ràng nhất ở cấp độ bán lẻ. Người dùng ở gói khuyến mãi báo cáo đã đốt 30% đến 60% tín dụng hàng tháng chỉ trong một vài prompt. Một người dùng cho biết Copilot đã đi từ gói đăng ký yêu thích nhất của họ trở thành gây căng thẳng nhất chỉ sau một đêm.

Sự Thức Tỉnh Về ROI

Trải nghiệm của Uber minh họa cho thách thức rộng lớn hơn. Giám đốc vận hành Andrew Macdonald đã thừa nhận tại một hội nghị ngày 25 tháng 5 rằng mặc dù 95% kỹ sư sử dụng công cụ AI hàng tháng, ông không thể vẽ ra một đường thẳng giữa khoản chi token đó và những cải tiến sản phẩm có ý nghĩa hướng đến người tiêu dùng. "Mối liên kết đó chưa có," Macdonald nói.

Microsoft Corp., đối mặt với hóa đơn Claude Code từ 500 đến 2.000 đô la cho mỗi kỹ sư hàng tháng, đã bắt đầu hủy giấy phép Claude Code trực tiếp và điều hướng các kỹ sư quay lại GitHub Copilot.

CEO Anthropic Dario Amodei đã thừa nhận rủi ro về thời điểm một cách rõ ràng. Trong một cuộc phỏng vấn tháng 2, ông cảnh báo rằng nếu dự báo tăng trưởng doanh thu AI sai lệch dù chỉ một năm, "thì bạn sẽ phá sản." Ông đang đề cập đến các khoản cược cơ sở hạ tầng của chính Anthropic, nhưng logic cũng áp dụng cho khách hàng doanh nghiệp. Nếu thanh toán dựa trên token cho thấy lợi ích năng suất không biện minh được cho chi phí, các doanh nghiệp sẽ không phá sản — họ chỉ đơn giản là ngừng gia hạn.

Đối với các nhà đầu tư, quá trình chuyển đổi thanh toán token là cơ chế khám phá giá thực sự đầu tiên mà ngành công nghiệp AI tạo ra. Các gói đăng ký phí cố định đã tạo ra những bức tranh thuận tiện: chi phí thấp, tỷ lệ áp dụng cao, và lợi tức đầu tư là câu hỏi để giải quyết sau. Thanh toán dựa trên mức sử dụng đã thay đổi cách tính toán đó chỉ sau một đêm. Các công ty có thể đo lường và chứng minh lợi tức đầu tư AI sẽ quyết định liệu cấu trúc vốn hiện tại có trụ vững hay không. Những công ty không thể sẽ là những công ty đầu tiên phải đàm phán lại và suy nghĩ lại.

Nvidia Corp., công ty có các bộ xử lý đồ họa cung cấp năng lượng cho phần lớn việc đào tạo và suy luận AI, đối mặt với một cú sốc phía cầu tiềm tàng nếu khách hàng doanh nghiệp đồng loạt giới hạn chi tiêu. Doanh thu trung tâm dữ liệu của công ty đã tăng hơn 200% so với cùng kỳ năm trước trong năm quý liên tiếp, nhưng sự tăng trưởng đó giả định mức tiêu thụ token ngày càng mở rộng. Một sự cắt giảm kéo dài trong ngân sách AI doanh nghiệp có thể nén quỹ đạo đó.

Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.