El nuevo agente Gemini Spark de Google tiene como objetivo ir más allá del chat y completar tareas de forma autónoma en su ecosistema, incluyendo la realización de compras en nombre del usuario.
El nuevo agente Gemini Spark de Google tiene como objetivo ir más allá del chat y completar tareas de forma autónoma en su ecosistema, incluyendo la realización de compras en nombre del usuario.

Google apuesta a que el futuro de la inteligencia artificial no reside en responder preguntas, sino en completar tareas. En su conferencia I/O 2026, la compañía presentó un conjunto de nuevos productos centrados en Gemini Spark, un agente de IA persistente diseñado para funcionar en los servicios de Google incluso cuando el usuario está desconectado, lo que marca su impulso más ambicioso hasta ahora en el mundo de los sistemas autónomos.
"Estamos en esa parte del ciclo en la que la gente quiere ver un valor real en los productos que usa en su día a día", dijo Sundar Pichai, CEO de Google y Alphabet, en una sesión informativa. Argumentó que con Spark, el valor proviene de un agente que opera las 24 horas del día en la nube de Google, por lo que "no es necesario tener la computadora portátil abierta para asegurarse de que esté funcionando".
El agente funciona con el nuevo modelo Gemini 3.5 Flash de Google y se ejecuta dentro de un marco llamado Antigravity, lo que le permite ejecutar flujos de trabajo de varios pasos en aplicaciones como Gmail, Docs y Calendar. El servicio estará disponible para los suscriptores de un nuevo plan Google AI Ultra, que comienza en 100 dólares al mes por cinco veces los límites de uso del plan Pro y 20 TB de almacenamiento.
Los anuncios colocan a Google en una carrera feroz contra Microsoft, OpenAI y Anthropic para construir el agente de IA definitivo. La compañía apuesta a que su profunda integración con los servicios al consumidor y un enorme plan de gasto de capital de 180.000 millones a 190.000 millones de dólares para el año le darán una ventaja decisiva en un mercado que pasa de la IA conversacional a la acción autónoma.
Para que los agentes sean realmente útiles, deben interactuar con el mundo real y, en particular, con el comercio. Google abordó esto introduciendo dos nuevos protocolos: el Protocolo de Pagos de Agentes (AP2) y el Protocolo de Comercio Universal (UCP). El AP2 es un sistema diseñado para permitir que los agentes de IA realicen compras seguras dentro de los límites definidos por el usuario, y Google compara las salvaguardias con darle a un adolescente su primera tarjeta de débito.
El sistema crea un vínculo verificable entre el usuario, el comerciante y el procesador de pagos. Está basado en el UCP, un estándar de código abierto anunciado a principios de este año que brinda a los agentes y sistemas comerciales un lenguaje común. El Consejo Técnico del UCP ahora incluye a rivales como Amazon, Meta y Microsoft, lo que sugiere un amplio consenso de la industria sobre la necesidad de un marco compartido para el comercio impulsado por agentes. Google también lanzará un Carrito Universal este verano que funcionará en Búsqueda, Gemini, YouTube y Gmail para rastrear precios y ofertas.
Junto con sus anuncios centrados en agentes, Google también lanzó herramientas destinadas a hacer que la IA sea más accesible para la creación de contenido. Google Pics, una nueva aplicación de diseño y generación de imágenes, se posiciona para competir directamente con Canva y Claude Design de Anthropic. Impulsado por el modelo Nano Banana 2, Pics permite a los usuarios generar y editar gráficos complejos mediante simples indicaciones de texto o dejando comentarios directamente sobre los elementos de la imagen, de forma similar a Google Docs.
Para video, Google está integrando su modelo Gemini Omni en YouTube Shorts. La función permite a los creadores generar y remezclar videos utilizando indicaciones de texto, imagen y audio. El sistema está diseñado para manejar ediciones complejas automáticamente mientras mantiene la consistencia de los personajes en las escenas. YouTube enfatizó las protecciones para los creadores, incluidas marcas de agua y controles de exclusión para remezclas generadas por IA.
La estrategia de Google con Spark es distinta de la de sus competidores. Mientras que el agente de OpenAI utiliza principalmente un navegador y Claude Cowork de Anthropic opera en el escritorio del usuario, Spark trabaja a través de integraciones de API estructuradas con las propias aplicaciones de Workspace de Google y servicios de terceros. Este enfoque promete una mayor confiabilidad y velocidad que la lectura de pantalla, pero también significa que las capacidades de Spark están limitadas inicialmente a los ecosistemas a los que Google está conectado.
La confiabilidad de estos sistemas autónomos sigue siendo un desafío crítico para toda la industria. Un agente que malinterprete la intención de un usuario podría tener consecuencias significativas, un riesgo que Google está mitigando en el lanzamiento al requerir la aprobación explícita del usuario para cualquier transacción financiera. La verdadera prueba para Gemini Spark no es si puede hacer el trabajo, sino si los usuarios confiarán en él lo suficiente como para permitirlo.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.