Một sự thay đổi căn bản trong kinh tế học AI đang diễn ra khi các nhà cung cấp lớn, bao gồm OpenAI, Google và Anthropic, tiến xa hơn mức định giá đơn giản theo từng token. Một phân tích ngành vào tháng 4 năm 2026 cho thấy các công ty này đã giới thiệu hóa đơn đa chiều tính phí riêng cho các dịch vụ như tìm kiếm, thời gian chạy và bộ nhớ đệm, thay đổi căn bản cách các doanh nghiệp tính toán và lập ngân sách cho AI.
"Tương lai sẽ mở rộng sang cấp phép, giao thức IP và định giá dựa trên kết quả," CFO Sarah Friar của OpenAI cho biết trong một tuyên bố vào tháng 1 năm 2026, báo hiệu một bước đi chiến lược vượt ra ngoài mô hình API dựa trên việc sử dụng duy nhất.
Bối cảnh định giá mới này đã có thể nhìn thấy được. Google hiện liệt kê "grounding" (tăng cường tìm kiếm) và bộ nhớ đệm ngữ cảnh thành các mục hàng riêng biệt. Anthropic tính phí thời gian chạy phiên ở mức 0,08 USD mỗi giờ ngoài các hệ số phân tầng cho bộ nhớ đệm. Bảng giá của OpenAI giống như một menu tài nguyên, với các khoản phí riêng biệt cho tìm kiếm web, sử dụng container theo giờ và lưu trữ tệp theo gigabyte mỗi ngày.
Hệ quả đối với các doanh nghiệp là chỉ số đơn giản về "chi phí cho mỗi token" hiện đã lỗi thời. Sự thay đổi này có thể sẽ hàng hóa hóa việc suy luận mô hình AI thô, gây áp lực lên các nhà cung cấp chỉ cạnh tranh về giá token, đồng thời tạo ra lợi thế cạnh tranh cho các nền tảng có thể tích hợp và định giá hiệu quả các dịch vụ cấp cao hơn. Sự phức tạp này cũng được kỳ vọng sẽ thúc đẩy nhu cầu của doanh nghiệp đối với một loại công cụ quản lý và tối ưu hóa chi phí AI mới.
Chi phí hiện phụ thuộc vào nhiệm vụ, không phải token
Động lực chính của hóa đơn AI không còn là bản thân mô hình mà là bản chất của công việc đang được thực hiện. Đối với một tác vụ truy xuất tần suất cao, trọng lượng nhẹ trên Gemini 2.5 Flash-Lite của Google, chi phí token cho một lần gọi có thể chỉ là 0,0009 USD. Tuy nhiên, nếu cuộc gọi đó bao gồm một "grounded prompt" vượt quá mức miễn phí, riêng phí grounding đã là 0,035 USD — cao gấp gần 40 lần chi phí của các token. Trong các khối lượng công việc như vậy, các công cụ bên ngoài như tìm kiếm sẽ chiếm ưu thế trong hóa đơn.
Ngược lại, đối với một phiên mã hóa thâm dụng suy luận bằng cách sử dụng một mô hình hàng đầu như GPT-5.4 của OpenAI, chi phí token vẫn là một yếu tố chính. Một phiên với 50.000 token đầu vào và 15.000 token đầu ra trên Opus 4.6 của Anthropic có giá 0,625 USD, trong khi phí thời gian chạy phiên một giờ tương ứng chỉ là 0,08 USD. Điều này chứng tỏ rằng đối với các tác vụ lập luận phức tạp, bản thân mô hình vẫn đại diện cho một phần đáng kể trong tổng chi phí. Các công ty hiện phải phân tích các trường hợp sử dụng cụ thể của mình để hiểu tổng chi phí, vì "chi phí đơn vị AI" phổ quát không còn tồn tại.
Ngăn xếp 5 tầng cho giá trị AI
Để hiểu mô hình kinh tế mới này, các nhà phân tích ngành đề xuất một ngăn xếp thanh toán năm tầng ánh xạ cách giá trị được tạo ra và thanh toán. Tầng dưới cùng là Tầng Tiện ích (Utility Layer), bao gồm các tài nguyên có thể đo lường được như tính toán, token, tìm kiếm và lưu trữ. Phía trên là Tầng Giao thức (Protocol Layer) cho khả năng tương tác, Tầng Kiến thức (Knowledge Layer) cho chuyên môn được tuần tự hóa như prompt và kỹ năng, và Tầng Thực thi (Execution Layer) cho "lao động kỹ thuật số" được quản lý.
Ở trên cùng là Tầng Kết quả & Trách nhiệm (Results & Responsibility Layer), nơi việc lập hóa đơn được gắn trực tiếp với hiệu suất. Mức giá 0,99 USD của Intercom cho mỗi vấn đề của khách hàng được "giải quyết" là một tín hiệu rõ ràng cho xu hướng này. Khi nền kinh tế AI trưởng thành, giá trị dự kiến sẽ di chuyển lên trên ngăn xếp này. Trong khi các tầng tiện ích thấp hơn trở thành hàng hóa như điện, các tầng trên, vốn gắn chặt vào bối cảnh kinh doanh và trách nhiệm giải trình, sẽ yêu cầu định giá dựa trên giá trị cao cấp. Tín hiệu then chốt cần theo dõi là khi các hợp đồng doanh nghiệp bắt đầu ít tập trung hơn vào giá token và nhiều hơn vào các thỏa thuận cấp độ dịch vụ và kết quả có thể kiểm chứng.
Bài viết này chỉ mang tính chất cung cấp thông tin và không cấu thành lời khuyên đầu tư.