El nuevo modelo Gemini 3.5 Flash de Google busca redefinir la frontera de la eficiencia de la IA, pero una nueva startup podría haberlo superado ya en términos de costes.
El nuevo modelo Gemini 3.5 Flash de Google busca redefinir la frontera de la eficiencia de la IA, pero una nueva startup podría haberlo superado ya en términos de costes.

Google está intensificando la carrera armamentista de la IA con un enfoque en la velocidad y el poder creativo, anunciando en su conferencia I/O 2026 el modelo Gemini 3.5 Flash y un nuevo generador de video, Gemini Omni. El movimiento se produce mientras la compañía compite por defender su territorio frente a OpenAI y Anthropic, al tiempo que surgen nuevos competidores altamente eficientes que desafían la estructura de costos de la industria.
"Esto representa un salto importante en la construcción de agentes más capaces e inteligentes", dijo Google sobre la nueva familia de modelos 3.5 en su anuncio. La compañía afirma que Gemini 3.5 Flash logra un rendimiento de primer nivel manteniendo la alta velocidad necesaria para los flujos de trabajo de agentes y el servicio a equipos de subagentes, dirigiéndose directamente a la necesidad del mercado empresarial de una IA escalable.
Los anuncios son parte de una ofensiva general para integrar Gemini en el ecosistema de Google, que ahora sirve a más de 900 millones de usuarios mensuales, frente a los 400 millones del año anterior. Junto con los nuevos modelos, Google reveló una aplicación Gemini renovada y "Daily Brief", una función de IA proactiva para suscriptores que escanea la bandeja de entrada y el calendario del usuario para organizar su día.
Lo que está en juego es el liderazgo en un sector tecnológico definido por un ritmo implacable de innovación e inmensos costos de capital. Mientras que los nuevos modelos de Google buscan equilibrar rendimiento y velocidad, la aparición de modelos hipereficientes de jugadores más pequeños cuestiona la economía a largo plazo para los clientes empresariales, desplazando potencialmente la base de la competencia desde la capacidad pura hacia el costo por consulta.
Gemini 3.5 Flash se posiciona como el modelo más rápido y rentable de Google hasta la fecha, diseñado para ser el predeterminado en muchos de sus servicios. La compañía afirma que supera a su predecesor, Gemini 3.1 Pro, en benchmarks clave de programación y agentes sin comprometer la inteligencia. El modelo está disponible de inmediato en la aplicación Gemini y a través del modo IA en la búsqueda de Google, con una versión Gemini 3.5 Pro más potente prevista para el próximo mes.
El anuncio más sorprendente fue Gemini Omni, un modelo multimodal que genera video a partir de cualquier combinación de entradas, incluyendo texto, imágenes, audio y otros videos. Esto va un paso más allá del modelo de texto a video anterior de Google, Veo 3, al permitir a los usuarios editar y transformar medios existentes a través de comandos conversacionales. Omni estará disponible para los suscriptores de Google AI en la aplicación Gemini y Google Flow, y se ofrecerá de forma gratuita a los creadores de YouTube Shorts. Para abordar las preocupaciones de seguridad, Google está integrando marcas de agua digitales SynthID en todos los videos generados por Omni.
Justo cuando Google detallaba su próxima generación de modelos, Perceptron Inc., una startup de dos años de antigüedad, podría haber redefinido ya la frontera de la eficiencia. La compañía lanzó su modelo insignia de análisis de video, Mk1, a un precio de API que es entre un 80% y un 90% más bajo que los modelos insignia de la generación actual de Google, OpenAI y Anthropic.
El Mk1 de Perceptron tiene un precio de solo 0.15 dólares por millón de tokens de entrada y 1.50 dólares por millón de tokens de salida. Según los benchmarks de la compañía, iguala o supera el rendimiento de modelos como Gemini 3.1 Pro y GPT-5 en tareas clave de video y razonamiento espacial. En el VSI-Bench para razonamiento temporal, Mk1 obtuvo una puntuación de 88.5, la más alta entre los modelos comparados. Esta combinación de alto rendimiento a un costo radicalmente bajo se dirige directamente a los mercados industriales y empresariales para aplicaciones como robótica, seguridad y control de calidad.
La existencia de un competidor como Perceptron resalta un desafío crítico para los incumbentes como Google. Mientras que los modelos de frontera acaparan los titulares, la batalla por la adopción empresarial generalizada puede ser ganada por el proveedor que pueda ofrecer una inteligencia "suficientemente buena" al menor costo de inferencia posible. Para los inversores, el panorama está cambiando de una carrera de rendimiento puro a una ecuación más compleja donde la eficiencia y la accesibilidad son igual de críticas, impactando la valoración y el potencial de ingresos de todo el sector de la IA.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.