- OpenAI đã ra mắt ba mô hình giọng nói mới trong Realtime API của mình.
- Các mô hình được thiết kế cho các cuộc hội thoại chân thực, dịch thuật và phiên âm.
- Các tính năng mới nhằm vào khách hàng doanh nghiệp trong nhiều lĩnh vực khác nhau.
Quay lại

OpenAI vào thứ Năm đã phát hành bộ ba mô hình giọng nói mới trong Realtime API của mình, nhằm cung cấp cho các nhà phát triển những công cụ để xây dựng các ứng dụng chạy bằng giọng nói có khả năng phản hồi nhanh và mạnh mẽ hơn. Các mô hình mới—GPT-Realtime-2, GPT-Realtime-Translate và GPT-Realtime-Whisper—được thiết kế để xử lý các nhiệm vụ hội thoại phức tạp, dịch thuật trực tiếp và phiên âm thời gian thực, một động thái thách thức trực tiếp các đối thủ đã có tên tuổi trên thị trường AI giọng nói.
"Cùng với nhau, các mô hình mà chúng tôi đang ra mắt sẽ chuyển đổi âm thanh thời gian thực từ phản hồi đơn giản sang các giao diện giọng nói thực sự có thể làm việc: lắng nghe, suy luận, dịch thuật, phiên âm và thực hiện hành động khi cuộc hội thoại diễn ra," công ty cho biết.
Mô hình chủ lực, GPT-Realtime-2, được xây dựng với khả năng suy luận cấp độ GPT-5 và được thiết kế để xử lý các yêu cầu phức tạp hơn của người dùng so với phiên bản tiền nhiệm. Công ty cũng đã ra mắt GPT-Realtime-Translate, hỗ trợ hơn 70 ngôn ngữ đầu vào và 13 ngôn ngữ đầu ra, và GPT-Realtime-Whisper để phiên âm giọng nói thành văn bản trực tiếp. Các mô hình mới có sẵn trong Realtime API của OpenAI, với mức giá dựa trên mức tiêu thụ token cho GPT-Realtime-2 và thanh toán theo phút cho Translate và Whisper.
Việc phát hành các mô hình này dự kiến sẽ làm gia tăng sự cạnh tranh trong không gian AI giọng nói, ảnh hưởng đến các công ty cung cấp dịch vụ tương tự. Các khả năng mới đặc biệt phù hợp cho các trường hợp sử dụng của doanh nghiệp như dịch vụ khách hàng, giáo dục và truyền thông. OpenAI đã tuyên bố rằng họ đã triển khai các biện pháp an toàn để ngăn chặn việc lạm dụng công nghệ, bao gồm khả năng tạm dừng các cuộc hội thoại vi phạm nguyên tắc nội dung của mình. Lần ra mắt này nâng cao vị thế cạnh tranh của OpenAI và có thể thúc đẩy việc áp dụng API của hãng, thúc đẩy tăng trưởng. Đây là một tín hiệu tích cực cho đối tác chính của họ, Microsoft, bằng cách củng cố bộ sản phẩm AI của mình.
Bài viết này chỉ mang tính chất thông tin và không cấu thành lời khuyên đầu tư.