MiniMax lanza el modelo M2.7 de código abierto tras mejorar su propio rendimiento en un 30%

MiniMax ha lanzado en código abierto su modelo M2.7, la primera IA agéntica de la industria que participa activamente en su propio ciclo de desarrollo y lo mejora, logrando un rendimiento a la par de los principales modelos propietarios.

MiniMax ha abierto oficialmente el código de MiniMax M2.7, su modelo de Mezcla de Expertos (MoE) más capaz, poniendo los pesos a disposición del público en Hugging Face. El modelo, que primero participó en su propio desarrollo para lograr una ganancia de rendimiento del 30%, obtuvo una puntuación del 56,22% en la prueba de ingeniería de software SWE-Pro, igualando a GPT-5.3-Codex y señalando un nuevo frente competitivo en el mercado de la IA de código abierto.

"Para probar los límites de la mejora autónoma, se le encargó a MiniMax M2.7 optimizar el rendimiento de programación de un modelo en un andamio interno", declaró la empresa en una publicación de su blog técnico. "Funcionó de forma totalmente autónoma, ejecutando un bucle iterativo de 'analizar trayectorias de fallo → planificar cambios → modificar código del andamio → ejecutar evaluaciones → comparar resultados → decidir mantener o revertir cambios' durante más de 100 rondas".

El proceso de autoevolución resultó en una mejora del rendimiento del 30% en las evaluaciones internas. En los bancos de pruebas públicos, el M2.7 alcanza resultados de vanguardia para modelos de código abierto, con una puntuación del 57,0% en Terminal Bench 2 y del 55,6% en la prueba de generación de código a nivel de repositorio VIBE-Pro, casi igualando al Opus 4.6 de Anthropic. El modelo se desarrolló en colaboración con fabricantes de hardware como Nvidia, Huawei Ascend y Moore Threads, garantizando una amplia compatibilidad inicial.

Este lanzamiento desafía la brecha de rendimiento entre los modelos de código abierto y los propietarios de firmas como OpenAI y Anthropic. Al abrir el código de un modelo capaz de automejora y con un alto rendimiento en tareas de ingeniería complejas del mundo real, MiniMax presiona a los incumbentes y proporciona una herramienta potente y de libre acceso para los desarrolladores, lo que podría desplazar la adquisición de IA empresarial de los costosos sistemas basados en API.

Una nueva arquitectura para el trabajo agéntico

MiniMax M2.7 forma parte de la serie M2 de modelos de Mezcla de Expertos (MoE) de la compañía. Esta arquitectura es más eficiente que los modelos densos, ya que solo se activa un subconjunto de parámetros durante la inferencia, lo que lo hace más rápido y económico de ejecutar. El modelo se basa en tres capacidades principales: ingeniería de software profesional, trabajo de oficina profesional y colaboración nativa multiagente, que MiniMax denomina "Agent Teams". Estas capacidades permiten al M2.7 completar tareas de productividad altamente complejas aprovechando habilidades sofisticadas y búsquedas dinámicas de herramientas.

Excelencia en ingeniería del mundo real

El rendimiento del modelo en pruebas que simulan retos de ingeniería del mundo real lo distingue. En SWE-Pro, que cubre tareas como el análisis de registros, la resolución de errores y la revisión de seguridad del código, la precisión del 56,22% del M2.7 iguala a la de GPT-5.3-Codex. Esto demuestra una capacidad para comprender la lógica operativa de los sistemas de software, no solo para generar código. El equipo de MiniMax informa que esta capacidad se ha utilizado internamente para reducir el tiempo de recuperación de incidentes en sistemas de producción en vivo a menos de tres minutos, con el modelo realizando de forma autónoma análisis de observabilidad, consultas a bases de datos y envío de solicitudes de fusión.

Más allá de la ingeniería: habilidades profesionales de oficina y finanzas

Además de su destreza en ingeniería, el MiniMax M2.7 se dirige a tareas profesionales de oficina. En la evaluación GDPval-AA, que mide la experiencia en el dominio en 45 modelos, el M2.7 logró una puntuación ELO de 1495, la más alta de todos los modelos de código abierto y solo por detrás de modelos propietarios de primer nivel como Opus 4.6 y GPT-5.4. En finanzas, el modelo puede actuar como un analista junior, capaz de leer de forma autónoma informes anuales, construir un modelo de previsión de ingresos y producir un informe de investigación. Este amplio conjunto de habilidades lo convierte en un competidor directo de los modelos posicionados para uso empresarial y profesional. La apertura del código de un modelo con estas capacidades verificadas podría acelerar la adopción de flujos de trabajo de IA agéntica en diversas industrias, impactando en los modelos de negocio de las empresas que dependen de la venta de acceso a sistemas similares de código cerrado.

Este artículo tiene fines puramente informativos y no constituye asesoramiento de inversión.