Chi phí suy luận tăng gấp bốn lần lên 8,4 tỷ USD, làm chệch hướng mục tiêu lợi nhuận
Các mô hình lợi nhuận của các công ty trí tuệ nhân tạo hàng đầu đang chịu áp lực nghiêm trọng khi chi phí vận hành dịch vụ của họ tăng lên. Cả OpenAI và Anthropic đều lỡ các mục tiêu lợi nhuận gộp nội bộ do chi phí suy luận cao hơn dự kiến—chi phí sử dụng máy chủ đám mây để tạo phản hồi cho người dùng. Năm ngoái, lợi nhuận gộp của OpenAI giảm từ 40% xuống 33%, thấp hơn đáng kể so với dự báo 46%. Anthropic cũng đối mặt với thách thức, với lợi nhuận gộp dự kiến năm 2025 là 40%, hiện thấp hơn 10 điểm phần trăm so với mục tiêu ban đầu.
Chi phí vượt mức là rất rõ ràng. Chi phí suy luận của OpenAI đã tăng gấp bốn lần vào năm ngoái lên 8,4 tỷ USD, vượt xa dự báo 6,6 tỷ USD. Công ty cho rằng mức tăng này là do nhu cầu dịch vụ cao hơn dự kiến, buộc họ phải mua thêm dung lượng máy chủ theo yêu cầu đắt đỏ hơn. Tương tự, chi phí suy luận của Anthropic dự kiến sẽ tăng hơn gấp ba lần lên 2,7 tỷ USD vào năm 2025. Việc lạm phát chi phí này đặc biệt đáng chú ý khi nó xảy ra trong bối cảnh giá điện toán đám mây tổng thể đang giảm và cả hai công ty đều tuyên bố đang cải thiện hiệu quả mô hình.
Người dùng miễn phí và công cụ video Sora gây áp lực tài chính
Áp lực tài chính của OpenAI bị ảnh hưởng nặng nề bởi lượng người dùng miễn phí khổng lồ. Trong số khoảng 910 triệu người dùng hoạt động hàng tuần, chỉ khoảng 5% là khách hàng trả phí. Năm ngoái, những người dùng miễn phí này đã chiếm 3,9 tỷ USD chi phí suy luận, gần một nửa tổng chi phí của công ty. Động thái này buộc những người đăng ký trả phí và khách hàng doanh nghiệp phải trợ cấp cho phần lớn việc sử dụng nền tảng.
Sự kết hợp sản phẩm cũng là một yếu tố thúc đẩy chi phí lớn. Các công cụ đòi hỏi nhiều tính toán như mô hình tạo video Sora của OpenAI tiêu thụ nhiều tài nguyên máy chủ hơn so với các truy vấn văn bản đơn giản. Công ty cũng đã hấp thụ chi phí đáng kể bằng cách cung cấp quyền truy cập không hạn chế vào các tính năng mạnh mẽ, chẳng hạn như khả năng tạo hình ảnh cách điệu của mô hình GPT-4o phổ biến, điều này tạm thời đã tạo ra một đợt tăng vọt lớn trong tiêu thụ tài nguyên máy tính.
Lợi nhuận người dùng trả phí cải thiện lên 70%
Bất chấp sự nén lợi nhuận tổng thể, OpenAI đã thể hiện những cải thiện hiệu quả đáng kể trong phân khúc khách hàng trả phí. Biên lợi nhuận của công ty từ doanh thu từ người dùng trả phí, sau khi trừ chi phí vận hành mô hình, đã cải thiện lên khoảng 70% vào tháng 10 năm ngoái. Điều này đánh dấu một sự gia tăng đáng kể so với mức 52% vào cuối năm trước và 35% vào tháng 1 năm 2024, cho thấy mô hình kinh doanh cốt lõi là khả thi nếu việc kiếm tiền có thể được mở rộng.
Để giải quyết sự mất cân bằng này, OpenAI đang theo đuổi các nguồn doanh thu mới, bao gồm quảng cáo và các cấp độ đăng ký mở rộng. Vào tháng 1, công ty đã ra mắt gói đăng ký ChatGPT có hỗ trợ quảng cáo với giá khoảng 5 đến 8 USD mỗi tháng. Nhìn về phía trước, OpenAI dự kiến sẽ đạt được lợi nhuận gộp 67% vào năm 2030, thời điểm đó dự kiến 94% trong số 850 tỷ USD chi phí suy luận sẽ được dành để phục vụ khách hàng trả phí. Việc đạt được mục tiêu dài hạn này trong khi quản lý các chi phí ngắn hạn đang vượt ngoài tầm kiểm soát vẫn là thách thức trọng tâm đối với nhà lãnh đạo AI này.