Kỷ nguyên AI giá rẻ, không giới hạn đang kết thúc — và một thị trường trí tuệ hai tầng đang nổi lên.
Giám đốc điều hành Coinbase Brian Armstrong dự đoán rằng 80% khối lượng công việc trí tuệ nhân tạo sẽ chuyển sang các mô hình có chi phí thấp hơn 99% so với các hệ thống tiên tiến hiện nay trong vòng 12 đến 18 tháng, khi ngành công nghiệp đối mặt với sự thiếu bền vững của định giá được trợ giá.
"Yếu tố giới hạn sẽ là năng lượng và khả năng tính toán, chứ không phải các mô hình tốt hơn," Armstrong viết trên X hôm Chủ nhật, đáp lại bài đăng của nhà đầu tư Tommy Shaughnessy, người đã phác thảo cách định giá API theo mức sử dụng đang đẩy chi tiêu AI doanh nghiệp vượt xa những gì các gói đăng ký giá cố định từng khiến các công ty kỳ vọng. Armstrong cho biết Coinbase đã định tuyến các truy vấn đến các mô hình rẻ hơn khi phù hợp, giúp chi phí AI của công ty "gần như không đổi" ngay cả khi lượng token sử dụng tăng theo cấp số nhân.
Dự báo của CEO Coinbase được đưa ra vài ngày sau khi GitHub Copilot của Microsoft chuyển từ gói đăng ký cố định sang thanh toán dựa trên token vào ngày 1/6, khiến hóa đơn của một số người dùng tăng tới 1.700%. Một người đăng ký đã đăng ước tính chi phí nội bộ cho thấy phí hàng tháng của họ tăng vọt từ 44,68 USD lên 754,29 USD, trong khi một người khác dự báo hóa đơn lên tới 847 USD. Sự thay đổi định giá này phản ánh một cuộc tính toán rộng hơn: Biên lợi nhuận hoạt động của OpenAI gần ở mức âm 122%, theo Shaughnessy, nghĩa là công ty hoàn toàn phụ thuộc vào vốn bên ngoài để trợ giá cho việc mua GPU và chi phí suy luận.
Thị trường Trí tuệ Hai tầng
Khung phân tích của Armstrong chia việc sử dụng AI thành hai loại. 20% khối lượng công việc còn lại yêu cầu hiệu suất đỉnh cao — nghiên cứu khoa học, điều phối tác nhân và thứ mà ông gọi là "tối đa hóa IQ" — sẽ tiếp tục chạy trên các mô hình tiên tiến như Anthropic's Opus 4.8 hoặc OpenAI's GPT-5.5. 80% còn lại sẽ chuyển sang các giải pháp thay thế rẻ hơn, một động thái mà ông so sánh với phần cứng tiêu dùng, nơi hầu hết người mua bỏ qua các thông số kỹ thuật cao nhất trên MacBook và máy tính chơi game.
Các yếu tố kinh tế đã ủng hộ sự phân kỳ này. DeepSeek V4 hoạt động trong phạm vi tương đương với Anthropic's Claude Opus trên chuẩn đánh giá lập trình SWE-bench với chi phí chỉ bằng khoảng 1/30, theo Shaughnessy. Giám đốc điều hành Hugging Face Clement Delangue trích dẫn nghiên cứu của Stanford cho thấy độ chính xác của mô hình cục bộ trên các truy vấn hội thoại và suy luận thực tế đã tăng lên 71,3% từ mức 23,2% trong năm 2023, với một phần nhỏ năng lượng và chi phí so với các cuộc gọi API.
CEO Box Aaron Levie gọi con số 99% của Armstrong là "hơi cực đoan" nhưng đồng ý rằng việc sử dụng AI sẽ phân tầng, với các công việc cao cấp dành cho các mô hình hàng đầu và các tác vụ khối lượng lớn dành cho các mô hình giá rẻ. "Phân bổ trí thông minh sẽ cực kỳ quan trọng," đồng sáng lập Harvey Winston Weinberg viết. Đồng sáng lập Glean Tony Gentilcore gọi phân tích của Armstrong là "hoàn toàn chính xác," đồng thời nói thêm rằng "các thị trường tài chính là những thị trường duy nhất ngoại suy giá Opus ra quy mô vô hạn."
Góc nhìn Đầu tư
Sự chuyển dịch sang các mô hình rẻ hơn đe dọa mô hình doanh thu của các nhà cung cấp AI cao cấp bao gồm OpenAI, Microsoft và Anthropic, những công ty đã dựa vào các gói đăng ký được trợ giá để xây dựng thị phần. Nếu 80% khối lượng công việc chuyển sang các giải pháp thay thế chi phí thấp, thị trường có thể tiếp cận cho các mô hình tiên tiến sẽ thu hẹp đáng kể. Các công ty cho phép suy luận hiệu quả về chi phí — bao gồm các nhà cung cấp mô hình mã nguồn mở và cơ sở hạ tầng định tuyến — sẽ được hưởng lợi. Nvidia, với các GPU H100 và B200 cung cấp năng lượng cho hầu hết quá trình đào tạo mô hình tiên tiến, phải đối mặt với một triển vọng phức tạp hơn: nhu cầu về khả năng tính toán có thể tăng lên, nhưng sức mạnh định giá có thể suy yếu khi các giải pháp thay thế rẻ hơn ngày càng phổ biến.
Bài viết này chỉ nhằm mục đích cung cấp thông tin và không cấu thành lời khuyên đầu tư.