Filtración de OpenAI GPT-5.4 Señala una Ventana de Contexto de 2 Millones de Tokens

Edgen Stock·Mar 02 2026, 11:26

Compartir a

Compartir a

Copiar enlace

Puntos clave

Filtraciones recientes de un ingeniero de OpenAI sugieren la inminente llegada de GPT-5.4, una actualización importante que redefinirá las capacidades de los modelos grandes. Se rumorea que el modelo contará con una ventana de contexto masiva y memoria persistente, lo que cambiará el panorama competitivo de los puntos de referencia de rendimiento brutos a la usabilidad práctica y desencadenará una nueva ola de demanda de hardware de memoria avanzado.

Un compromiso de código accidental por parte de un ingeniero de OpenAI reveló el modelo "gpt-5.4", con filtraciones posteriores que mostraban puntos finales alfa antes de ser rápidamente retractados.
Las características rumoreadas incluyen una ventana de contexto de 2 millones de tokens y una "IA con estado" (Stateful AI), lo que permite que el modelo retenga la memoria y el contexto a través de diferentes sesiones de usuario.
Se espera que la nueva arquitectura encienda una "guerra de la memoria" para los proveedores de hardware, impulsando la demanda de memoria de alto ancho de banda (HBM) e interconexiones ópticas.

El código filtrado sugiere que GPT-5.4 cuenta con una ventana de contexto de 2 millones de tokens

Una presentación de código involuntaria a un repositorio público de GitHub por parte de un ingeniero de OpenAI reveló la designación "gpt-5.4", lo que provocó una amplia especulación sobre un lanzamiento inminente. La filtración fue corroborada por capturas de pantalla de un punto final "alpha-gpt-5.4" que circulaban en las redes sociales. La rápida respuesta de OpenAI, eliminando las publicaciones originales y sobrescribiendo el código para que leyera "gpt-5.3-codex", ha sido interpretada por los observadores del mercado como la confirmación de una divulgación no planificada en lugar de un simple error.

Los detalles filtrados sugieren un giro estratégico lejos de las mejoras incrementales de referencia. La característica principal es una ventana de contexto rumoreada de 2 millones de tokens, una expansión masiva que, combinada con la "IA con estado" (Stateful AI), otorgaría al modelo una memoria persistente. Esto le permite retener flujos de trabajo e historial de proyectos entre sesiones, transformando la experiencia del usuario de una serie de chats inconexos en una asociación cognitiva continua. Otras filtraciones apuntan a una capacidad de visión mejorada que puede procesar bytes de imagen crudos de resolución completa, lo que permite un análisis perfecto de píxeles de diseños detallados y esquemas de ingeniería.

La nueva arquitectura del modelo encenderá una "guerra de la memoria" en el sector del hardware

La transición a un modelo con una vasta ventana de contexto y memoria de estado persistente está destinada a crear cambios significativos en la demanda en los mercados de semiconductores y hardware. Esta arquitectura requiere un aumento explosivo en el tamaño de la caché de clave-valor (KV), lo que impone demandas extremas en el ancho de banda de la memoria. En consecuencia, el mercado de memoria de alto ancho de banda (HBM) y RAM estática (SRAM) está preparado para un aumento, ya que estos componentes son críticos para gestionar los enormes requisitos de memoria del modelo.

Esta evolución del software se traduce directamente en un desafío de hardware, llevando al límite la infraestructura actual. La necesidad de gestionar flujos de datos tan grandes de manera eficiente también está acelerando la transición de conceptos teóricos a la implementación práctica de tecnologías como las interconexiones ópticas. El movimiento de OpenAI indica que probablemente ha asegurado la arquitectura de hardware subyacente para soportar este salto generacional, posicionando a sus socios de hardware para un crecimiento sustancial a medida que la industria siga su ejemplo.