Anthropic suma a 12 gigantes tecnológicos a su iniciativa de ciberdefensa con IA

La startup de IA Anthropic lanzó el martes el Proyecto Glasswing, una coalición con 12 gigantes de la tecnología y las finanzas, para desplegar su modelo Claude Mythos Preview no publicado con el fin de encontrar y parchear vulnerabilidades críticas de software. La iniciativa reúne a competidores como Google y Microsoft con empresas consolidadas de ciberseguridad como CrowdStrike y Palo Alto Networks para adelantarse a las amenazas impulsadas por la IA.

"Dado el ritmo de progreso de la IA, no pasará mucho tiempo antes de que tales capacidades proliferen... Las consecuencias —para las economías, la seguridad pública y la seguridad nacional— podrían ser graves", dijo Newton Cheng, líder de Ciberseguridad del Frontier Red Team en Anthropic, en una entrevista.

El modelo ya ha identificado miles de fallos, incluida una vulnerabilidad de 27 años en el sistema operativo OpenBSD de alta seguridad y un error de 16 años en la biblioteca de vídeo FFmpeg, según un comunicado de la empresa. En el banco de pruebas de evaluación CyberGym, Mythos Preview obtuvo un 83,1 por ciento, superando con creces el 66,6 por ciento del siguiente mejor modelo de Anthropic, Claude Opus 4.6.

El proyecto tiene como objetivo dar ventaja a los defensores mientras los ingresos anualizados de Anthropic superan los 30.000 millones de dólares en medio de informes sobre una posible salida a bolsa en octubre de 2026. Para socios como Palo Alto Networks y CrowdStrike, la iniciativa representa una prueba crítica de las capacidades defensivas de la IA contra los ataques impulsados por IA que están remodelando el sector de la ciberseguridad, que vio caer las acciones de ambas firmas el mes pasado ante las noticias sobre el poder del modelo.

Un modelo demasiado peligroso para el lanzamiento público

Anthropic afirma que no pondrá a disposición del público general Claude Mythos Preview debido a sus avanzadas capacidades de ciberseguridad. Las pruebas internas de la empresa muestran que el modelo puede encontrar de forma autónoma y encadenar varias vulnerabilidades en el núcleo de Linux para escalar desde el acceso de un usuario ordinario al control completo de una máquina. Su rendimiento en los bancos de pruebas de codificación destaca la brecha de capacidad, con una puntuación del 93,9 por ciento en SWE-bench Verified, en comparación con el 80,8 por ciento de Opus 4.6.

La empresa se compromete a aportar hasta 100 millones de dólares en créditos de uso para los socios y a donar 4 millones de dólares a organizaciones de seguridad de código abierto, incluidas la Linux Foundation y la Apache Software Foundation, para gestionar el proceso de divulgación. "En el pasado, la experiencia en seguridad ha sido un lujo", dijo Jim Zemlin, director ejecutivo de la Linux Foundation. "El Proyecto Glasswing ofrece un camino creíble para cambiar esa ecuación".

Una apuesta por la transparencia en medio de fallos de seguridad

El anuncio sigue a varios incidentes de seguridad vergonzosos para Anthropic, incluida una mala configuración del CMS en marzo que expuso documentos internos y un error de empaquetado que filtró brevemente el código fuente de su herramienta Claude Code. Aunque la empresa declaró que se trataba de errores humanos en las herramientas de publicación y no de brechas en su arquitectura de seguridad principal, los incidentes plantean dudas sobre la confianza mientras pide a sus socios que confíen en su modelo más potente.

Anthropic sostiene que el proyecto es una apuesta necesaria. La empresa cree que las capacidades de modelos como Mythos Preview se generalizarán en meses, no en años, y que el único movimiento responsable es armar primero a los defensores. Es la apuesta de que proporcionar acceso restringido a los socios ahora puede construir una defensa más sólida antes de que herramientas ofensivas similares caigan en manos menos cuidadosas.

Este artículo tiene únicamente fines informativos y no constituye asesoramiento de inversión.