GPT-5.4 Mini reduce la brecha de rendimiento al 3.3% con un costo un 70% menor
El 17 de marzo, OpenAI lanzó dos nuevos modelos de inteligencia artificial más pequeños, GPT-5.4 mini y nano, alterando fundamentalmente la ecuación costo-rendimiento para los desarrolladores. El modelo GPT-5.4 mini ofrece un rendimiento que rivaliza estrechamente con su contraparte insignia, GPT-5.4, pero a un precio significativamente más bajo. El precio de la API del mini se establece en $0.75 por millón de tokens de entrada y $4.50 por millón de tokens de salida, lo que representa una reducción de costos del 70% en comparación con las tarifas respectivas del modelo insignia de $2.50 y $15.00.
Esta eficiencia de costos no viene con un compromiso importante en cuanto a capacidad. En el benchmark SWE-bench Pro, que prueba la capacidad de resolver problemas reales de GitHub, GPT-5.4 mini logró una puntuación del 54.4%, solo 3.3 puntos porcentuales por debajo del 57.7% del modelo insignia GPT-5.4. En las tareas de operación de computadora medidas por el benchmark OSWorld-Verified, el modelo mini obtuvo un 72.1%, casi igualando el 75.0% del modelo insignia y superando ligeramente la base humana del 72.4%.
Nuevos modelos habilitan la arquitectura de 'subagentes' para flujos de trabajo de IA
El lanzamiento señala un impulso estratégico hacia sistemas multimodelos donde una IA potente actúa como coordinadora para modelos más pequeños y rápidos. Esta arquitectura de 'subagentes' permite a los desarrolladores delegar tareas de gran volumen y menos complejas a modelos más baratos, reservando la costosa IA insignia para la planificación y el razonamiento de alto nivel. Por ejemplo, dentro del asistente de programación Codex de OpenAI, GPT-5.4 puede orquestar tareas mientras que los subagentes GPT-5.4 mini manejan trabajos paralelos como búsquedas de código y revisiones de archivos a aproximadamente un tercio del costo.
Este enfoque es crítico para aplicaciones sensibles a la latencia donde la velocidad de respuesta impacta directamente la experiencia del usuario. La capacidad de los nuevos modelos para manejar llamadas de herramientas complejas de manera confiable a bajo costo es un paso significativo para la industria.
Hasta hace poco, solo los modelos más caros podían navegar de manera confiable por las llamadas de herramientas de agente. Hoy, modelos más pequeños como GPT-5.4 mini y nano pueden manejarlas fácilmente, lo que permitirá a nuestros usuarios construir Agentes Personalizados en Notion y elegir exactamente la cantidad de inteligencia que necesitan.
— Abhisek Modi, Líder de Ingeniería de IA en Notion.
GPT-5.4 Nano apunta a tareas de alto volumen a $0.20 por millón de tokens
Posicionado como la opción más económica, GPT-5.4 nano está disponible exclusivamente a través de la API de OpenAI y tiene un precio de solo $0.20 por millón de tokens de entrada y $1.25 por millón de tokens de salida. OpenAI diseñó este modelo específicamente para tareas de alta frecuencia y baja complejidad, como clasificación de datos, extracción de texto y soporte de codificación simple.
Si bien el rendimiento de nano en tareas visuales como OSWorld-Verified es inferior al de sus predecesores, demuestra una mejora significativa con respecto a modelos pequeños anteriores en los benchmarks de razonamiento y uso de herramientas. Por ejemplo, su puntuación del 82.8% en la prueba de inteligencia general GPQA Diamond supera el 81.6% del antiguo GPT-5 mini. La introducción de nano proporciona a los desarrolladores una herramienta altamente especializada para construir sistemas de IA rentables donde la velocidad y el presupuesto son las principales limitaciones.