- OpenAI ha lanzado tres nuevos modelos de voz en su API Realtime.
- Los modelos están diseñados para conversaciones realistas, traducción y transcripción.
- Las nuevas funciones están dirigidas a clientes corporativos de diversos sectores.
Atrás

OpenAI lanzó este jueves un trío de nuevos modelos de voz en su API Realtime, con el objetivo de proporcionar a los desarrolladores herramientas para crear aplicaciones impulsadas por voz más receptivas y capaces. Los nuevos modelos —GPT-Realtime-2, GPT-Realtime-Translate y GPT-Realtime-Whisper— están diseñados para gestionar tareas conversacionales complejas, traducción en vivo y transcripción en tiempo real, un movimiento que desafía directamente a los actores establecidos en el mercado de la IA de voz.
"Juntos, los modelos que estamos lanzando trasladan el audio en tiempo real de una simple respuesta a llamadas hacia interfaces de voz que realmente pueden trabajar: escuchar, razonar, traducir, transcribir y tomar medidas a medida que se desarrolla una conversación", señaló la empresa.
El modelo insignia, GPT-Realtime-2, cuenta con una capacidad de razonamiento de clase GPT-5 y está diseñado para manejar solicitudes de usuarios más complejas que su predecesor. La compañía también lanzó GPT-Realtime-Translate, que admite más de 70 idiomas de entrada y 13 idiomas de salida, y GPT-Realtime-Whisper para la transcripción de voz a texto en vivo. Los nuevos modelos están disponibles en la API Realtime de OpenAI, con precios basados en el consumo de tokens para GPT-Realtime-2 y facturación por minuto para Translate y Whisper.
Se espera que el lanzamiento de estos modelos intensifique la competencia en el espacio de la IA de voz, impactando a las empresas que brindan servicios similares. Las nuevas capacidades son particularmente relevantes para casos de uso empresarial como el servicio al cliente, la educación y los medios de comunicación. OpenAI ha afirmado que ha implementado medidas de seguridad para evitar el mal uso de la tecnología, incluida la capacidad de detener conversaciones que violen sus directrices de contenido. Este lanzamiento mejora la posición competitiva de OpenAI y podría aumentar la adopción de su API, impulsando el crecimiento. Es una señal alcista para su socio clave, Microsoft, al fortalecer su suite de productos de IA.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.