GPT-5.4 Mini thu hẹp khoảng cách hiệu suất xuống 3.3% với chi phí thấp hơn 70%
Vào ngày 17 tháng 3, OpenAI đã ra mắt hai mẫu trí tuệ nhân tạo nhỏ hơn mới, GPT-5.4 mini và nano, về cơ bản đã thay đổi phương trình chi phí-hiệu suất cho các nhà phát triển. Mẫu GPT-5.4 mini mang lại hiệu suất gần như ngang bằng với mẫu flagship GPT-5.4 của nó, nhưng với mức giá thấp hơn đáng kể. Giá API của mẫu mini được đặt ở mức 0.75 USD mỗi triệu token đầu vào và 4.50 USD mỗi triệu token đầu ra, đại diện cho việc giảm 70% chi phí so với mức giá tương ứng của mẫu flagship là 2.50 USD và 15.00 USD.
Hiệu quả chi phí này không đi kèm với sự đánh đổi lớn về khả năng. Trong bài kiểm tra SWE-bench Pro, kiểm tra khả năng giải quyết các vấn đề GitHub trong thế giới thực, GPT-5.4 mini đạt được 54.4%, chỉ kém 3.3 điểm phần trăm so với 57.7% của mẫu flagship GPT-5.4. Trong các tác vụ vận hành máy tính được đo bằng chuẩn OSWorld-Verified, mẫu mini đạt 72.1%, gần bằng 75.0% của mẫu flagship và hơi vượt qua mức cơ bản của con người là 72.4%.
Các mẫu mới cho phép kiến trúc 'tác nhân phụ' cho quy trình làm việc AI
Việc phát hành này báo hiệu một động thái chiến lược hướng tới các hệ thống đa mẫu, nơi một AI mạnh mẽ đóng vai trò điều phối viên cho các mẫu nhỏ hơn, nhanh hơn. Kiến trúc 'tác nhân phụ' này cho phép các nhà phát triển ủy thác các tác vụ khối lượng lớn, ít phức tạp hơn cho các mẫu rẻ hơn, dành AI flagship đắt tiền cho việc lập kế hoạch và suy luận cấp cao. Ví dụ, trong trợ lý lập trình Codex của OpenAI, GPT-5.4 có thể điều phối các tác vụ trong khi các tác nhân phụ GPT-5.4 mini xử lý các công việc song song như tìm kiếm mã và xem xét tệp với chi phí chỉ bằng khoảng một phần ba.
Cách tiếp cận này rất quan trọng đối với các ứng dụng nhạy cảm với độ trễ, nơi tốc độ phản hồi ảnh hưởng trực tiếp đến trải nghiệm người dùng. Khả năng xử lý các cuộc gọi công cụ phức tạp một cách đáng tin cậy với chi phí thấp của các mẫu mới là một bước tiến đáng kể cho ngành.
Cho đến gần đây, chỉ những mẫu đắt tiền nhất mới có thể điều hướng đáng tin cậy các cuộc gọi công cụ tác nhân. Hôm nay, các mẫu nhỏ hơn như GPT-5.4 mini và nano có thể dễ dàng xử lý điều đó, điều này sẽ cho phép người dùng của chúng tôi xây dựng Custom Agents trên Notion và chọn chính xác lượng thông minh mà họ cần.
— Abhisek Modi, Trưởng nhóm Kỹ thuật AI tại Notion.
GPT-5.4 Nano nhắm mục tiêu các tác vụ khối lượng lớn với 0.20 USD mỗi triệu token
Được định vị là lựa chọn kinh tế nhất, GPT-5.4 nano chỉ có sẵn thông qua API của OpenAI và có giá chỉ 0.20 USD mỗi triệu token đầu vào và 1.25 USD mỗi triệu token đầu ra. OpenAI đã thiết kế mẫu này đặc biệt cho các tác vụ tần suất cao, độ phức tạp thấp như phân loại dữ liệu, trích xuất văn bản và hỗ trợ mã hóa đơn giản.
Mặc dù hiệu suất của nano trên các tác vụ trực quan như OSWorld-Verified thấp hơn các mẫu tiền nhiệm, nhưng nó thể hiện sự cải thiện đáng kể so với các mẫu nhỏ trước đây trong các chuẩn suy luận và sử dụng công cụ. Chẳng hạn, điểm số 82.8% của nó trong bài kiểm tra trí thông minh tổng quát GPQA Diamond vượt qua 81.6% của GPT-5 mini cũ hơn. Việc giới thiệu nano cung cấp cho các nhà phát triển một công cụ chuyên biệt cao để xây dựng các hệ thống AI hiệu quả về chi phí, nơi tốc độ và ngân sách là những hạn chế chính.