GPT-5.3-Codex logra un 77.3% de puntuación, superando al modelo rival
OpenAI ha encendido un conflicto directo con su competidor Anthropic, lanzando su nuevo modelo de programación, GPT-5.3-Codex, el jueves en el momento preciso en que Anthropic lanzó su actualización insignia, Claude Opus 4.6. Este lanzamiento sincronizado marca una escalada significativa en la batalla por el mercado de software de IA empresarial. OpenAI afirma que su nuevo modelo es un gran avance, logrando un 77.3% en el benchmark Terminal-Bench 2.0, una prueba que mide las habilidades esenciales de operación de terminal para agentes de programación. Esto representa una mejora de 13 puntos porcentuales con respecto a su predecesor y supera significativamente el 65.4% de puntuación reportado por el Opus 4.6 de Anthropic.
Más allá de los benchmarks, OpenAI destacó importantes ganancias de eficiencia, afirmando que el nuevo modelo requiere menos de la mitad de los tokens de su predecesor al tiempo que aumenta la velocidad de inferencia en más del 25%. En un hito para la industria, la compañía también reveló que las primeras versiones de GPT-5.3-Codex se utilizaron en su propio desarrollo, depuración y despliegue. El CEO de OpenAI, Sam Altman, señaló: "Ver cómo usábamos 5.3-Codex para construir 5.3-Codex... fue un poderoso atisbo del futuro."
El gasto en IA empresarial alcanzará los 11.6 millones de dólares por firma mientras la ventaja de OpenAI se reduce
La carrera armamentística tecnológica se alimenta de una explosión en el gasto en IA corporativa. Según una encuesta de Andreessen Horowitz, el gasto promedio empresarial en grandes modelos de lenguaje alcanzará los 7 millones de dólares en 2025, un aumento del 180% respecto a los 2.5 millones de dólares gastados en 2024. Se proyecta que esta cifra crecerá otro 65% hasta los 11.6 millones de dólares para 2026. Este "botín" en rápida expansión está intensificando la competencia por la cuota de mercado.
Los mismos datos revelan un panorama cambiante. Aunque OpenAI sigue siendo el actor dominante, se pronostica que su cuota en el gasto en IA empresarial se reducirá del 62% en 2024 al 53% para 2026. Durante el mismo período, se espera que la cuota de mercado de Anthropic aumente del 14% al 18%, y Google también capturará una porción creciente del mercado. Esta presión competitiva ayuda a explicar la rivalidad cada vez más pública, que recientemente vio a Altman y Anthropic discutir sobre estrategias publicitarias.
OpenAI expande Codex de codificador a agente generalista
OpenAI está reposicionando estratégicamente Codex de un asistente de programación especializado a un agente versátil capaz de manejar una amplia gama de trabajo de conocimiento. La compañía declaró que el modelo ahora puede gestionar tareas desde la depuración y el despliegue hasta la investigación de usuarios y el análisis de datos en hojas de cálculo, señalando un desafío directo al mercado más amplio de software de productividad empresarial dominado por actores como Microsoft y Salesforce.
Para reforzar su posición, OpenAI también designó a GPT-5.3-Codex como su primer modelo con "alta capacidad" en ciberseguridad, entrenado específicamente para identificar vulnerabilidades de software. Para acelerar la adopción y las capacidades de defensa, Altman anunció un compromiso de 10 millones de dólares en créditos API para investigadores de ciberseguridad.
Esta es la era de los constructores, no de las personas que quieren controlarlos.
— Sam Altman, CEO, OpenAI