OpenAI đã cắt giảm một nửa chi phí suy luận, tạo dư địa để hạ giá đối thủ trong khi chuẩn bị huy động 120 tỷ USD.
OpenAI đã cắt giảm một nửa chi phí suy luận, tạo dư địa để hạ giá đối thủ trong khi chuẩn bị huy động 120 tỷ USD.

OpenAI đã cắt giảm một nửa chi phí suy luận, tạo dư địa để hạ giá đối thủ trong khi chuẩn bị huy động 120 tỷ USD.
Các kỹ sư của OpenAI đã giảm hơn 50% chi phí suy luận đối với một số mô hình hiện có, giúp công ty định giá mô hình GPT-5.6 Sol hàng đầu của mình chỉ bằng một nửa chi phí so với Claude Fable 5 của Anthropic, đồng thời vẫn vượt trội hơn đối thủ trên các chuẩn đánh giá.
Công ty coi phương pháp này là "công thức bí mật" với các biện pháp kiểm soát truy cập nội bộ nghiêm ngặt, theo The Information. "Họ thậm chí không muốn tiết lộ cho các nhân viên khác của OpenAI vì nếu điều này bị rò rỉ, các phòng thí nghiệm khác có thể áp dụng và giảm chi phí của họ," phóng viên Steph Palazzolo cho biết.
Sol đạt điểm cao hơn Claude Mythos 5 của Anthropic trên chuẩn Terminal-Bench 2.1 nhưng lại có chi phí thấp hơn 50% so với Claude Fable 5. Những cải thiện về hiệu suất cũng cho phép OpenAI chạy lưu lượng ChatGPT dành cho người dùng chưa đăng nhập chỉ trên vài trăm GPU Nvidia, một phần nhỏ so với yêu cầu thông thường đối với dịch vụ phục vụ hàng trăm triệu người dùng hoạt động hàng tháng.
Lợi thế về chi phí đến trong bối cảnh OpenAI chuẩn bị vòng gọi vốn 120 tỷ USD với mức định giá trước vốn là 730 tỷ USD, khi Giám đốc điều hành Sam Altman thúc đẩy kế hoạch phát hành cổ phiếu lần đầu ra công chúng (IPO) trước Anthropic. Việc cải thiện biên lợi nhuận mang lại nền tảng tài chính quan trọng cho câu chuyện định giá đó, vốn phụ thuộc vào sự cải thiện lợi nhuận bền vững.
Chuyển hướng sang Doanh nghiệp
Bước đột phá về chi phí suy luận hỗ trợ cho sự thay đổi chiến lược rộng lớn hơn tại OpenAI. Giám đốc mảng ứng dụng Fidji Simo đã nói với nhân viên trong một cuộc họp toàn thể gần đây rằng công ty sẽ giảm ưu tiên các sản phẩm tiêu dùng như trình tạo video Sora — vốn đã bị đóng cửa để chuyển hướng tài nguyên tính toán — và tập trung vào các công cụ doanh nghiệp và sản phẩm lập trình nơi biên lợi nhuận cao hơn. Động thái này phản ánh sự thừa nhận rằng các sản phẩm AI tiêu dùng phải đối mặt với biên lợi nhuận mỏng và sự cạnh tranh khốc liệt từ các lựa chọn thay thế miễn phí, trong khi khách hàng doanh nghiệp trả giá cao hơn cho độ tin cậy, bảo mật và khả năng tùy chỉnh.
Việc OpenAI tập trung vào các công cụ lập trình đặc biệt mang tính chiến lược. Phát triển phần mềm đại diện cho một trong những thị trường có thể tiếp cận lớn nhất đối với AI, với GitHub Copilot và các công cụ tương tự đã tạo ra hàng tỷ USD doanh thu hàng năm. Bằng cách kết hợp chi phí suy luận thấp hơn với hiệu suất lập trình vượt trội, OpenAI có thể hạ giá so với các đối thủ như GitHub Copilot và CodeWhisperer của Amazon đồng thời vẫn duy trì chất lượng.
Độc lập về Cơ sở hạ tầng
Việc cắt giảm chi phí cũng phù hợp với nỗ lực của OpenAI nhằm sở hữu nhiều hơn cơ sở hạ tầng của mình. Công ty gần đây đã hợp tác với Broadcom để phát triển chip suy luận tùy chỉnh, một động thái có thể giảm sự phụ thuộc vào GPU Nvidia. Doanh thu trung tâm dữ liệu của Nvidia đạt 62 tỷ USD trong năm tài chính gần nhất, được thúc đẩy phần lớn bởi khối lượng công việc suy luận AI chạy trên các bộ xử lý H100 và B200. Một chip tùy chỉnh có thể giúp OpenAI tiết kiệm hàng tỷ USD hàng năm trong chi phí mua GPU, qua đó mở rộng thêm lợi thế biên lợi nhuận so với các đối thủ phụ thuộc vào phần cứng của bên thứ ba.
Những cải thiện về hiệu suất có thể đến từ các kỹ thuật bao gồm lượng tử hóa — giảm độ chính xác của trọng số mô hình để tăng tốc tính toán — và tối ưu hóa bộ nhớ đệm nhằm lưu trữ các kết quả thường được sử dụng. Các phương pháp này đều được biết đến rộng rãi trong ngành, nhưng khả năng đạt được mức giảm 50% của OpenAI gợi ý những cải tiến độc quyền mà các đối thủ chưa thể sánh kịp.
Đối với các nhà đầu tư, câu hỏi then chốt là liệu lợi thế chi phí của OpenAI có bền vững hay không. Nếu các đối thủ như Anthropic, Google DeepMind hoặc Meta tái tạo được cách tiếp cận này, lợi thế về giá có thể nhanh chóng bị xói mòn. Cổ phiếu của OpenAI chưa được giao dịch công khai, nhưng mức định giá 730 tỷ USD trên thị trường tư nhân cho thấy các nhà đầu tư đã định giá mức cải thiện biên lợi nhuận bền vững — khiến bất kỳ sự xói mòn nào của lợi thế này cũng trở thành rủi ro đối với câu chuyện IPO. Quan hệ đối tác với Broadcom và sự bí mật nội bộ xung quanh các phương pháp giảm chi phí cho thấy OpenAI đang đặt cược rằng vị thế dẫn đầu về hiệu suất suy luận sẽ kéo dài đủ lâu để củng cố thị phần trước khi các đối thủ bắt kịp.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.