Le nouvel agent Gemini Spark de Google vise à aller au-delà du simple chat et à accomplir de manière autonome des tâches au sein de son écosystème, y compris effectuer des achats au nom de l'utilisateur.
Le nouvel agent Gemini Spark de Google vise à aller au-delà du simple chat et à accomplir de manière autonome des tâches au sein de son écosystème, y compris effectuer des achats au nom de l'utilisateur.

Google parie que l'avenir de l'intelligence artificielle ne réside pas dans la réponse à des questions, mais dans l'accomplissement de tâches. Lors de sa conférence I/O 2026, l'entreprise a dévoilé une suite de nouveaux produits centrés sur Gemini Spark, un agent d'IA persistant conçu pour fonctionner à travers les services de Google même lorsque l'utilisateur est hors ligne, marquant ainsi sa poussée la plus ambitieuse à ce jour dans le monde des systèmes autonomes.
« Nous sommes dans cette phase du cycle où les gens veulent voir une valeur réelle dans les produits qu'ils utilisent au quotidien », a déclaré Sundar Pichai, PDG de Google et d'Alphabet, lors d'un briefing. Il a soutenu qu'avec Spark, la valeur provient d'un agent qui fonctionne 24 heures sur 24 dans le cloud de Google, de sorte que « vous n'avez pas besoin de garder votre ordinateur portable ouvert pour vous assurer qu'il fonctionne ».
L'agent est propulsé par le nouveau modèle Gemini 3.5 Flash de Google et s'exécute au sein d'une structure appelée Antigravity, lui permettant d'exécuter des flux de travail en plusieurs étapes sur des applications telles que Gmail, Docs et Calendar. Le service sera disponible pour les abonnés d'un nouveau forfait Google AI Ultra, qui commence à 100 dollars par mois pour des limites d'utilisation cinq fois supérieures à celles du forfait Pro et 20 To de stockage.
Ces annonces placent Google dans une course féroce contre Microsoft, OpenAI et Anthropic pour construire l'agent d'IA définitif. L'entreprise parie que son intégration profonde avec les services grand public et un plan massif de dépenses d'investissement de 180 à 190 milliards de dollars pour l'année lui donneront un avantage décisif sur un marché qui passe de l'IA conversationnelle à l'action autonome.
Pour que les agents deviennent vraiment utiles, ils doivent interagir avec le monde réel, et particulièrement avec le commerce. Google a répondu à ce besoin en introduisant deux nouveaux protocoles : l'Agent Payments Protocol (AP2) et l'Universal Commerce Protocol (UCP). L'AP2 est un système conçu pour permettre aux agents d'IA d'effectuer des achats sécurisés dans des limites définies par l'utilisateur, Google comparant ces mesures de protection au fait de donner à un adolescent sa première carte de débit.
Le système crée un lien vérifiable entre l'utilisateur, le marchand et le processeur de paiement. Il est basé sur l'UCP, une norme open source annoncée plus tôt cette année qui donne aux agents et aux systèmes commerciaux un langage commun. Le Conseil technique de l'UCP comprend désormais des rivaux tels qu'Amazon, Meta et Microsoft, ce qui suggère un large consensus de l'industrie sur la nécessité d'un cadre partagé pour le commerce piloté par les agents. Google déploiera également un Panier universel cet été qui fonctionnera sur Search, Gemini, YouTube et Gmail pour suivre les prix et les offres.
Parallèlement à ses annonces axées sur les agents, Google a également lancé des outils visant à rendre l'IA plus accessible pour la création de contenu. Google Pics, une nouvelle application de conception et de génération d'images, se positionne pour concurrencer directement Canva et Claude Design d'Anthropic. Propulsé par le modèle Nano Banana 2, Pics permet aux utilisateurs de générer et de modifier des graphiques complexes à l'aide de simples invites textuelles ou en laissant des commentaires directement sur les éléments de l'image, à l'instar de Google Docs.
Pour la vidéo, Google intègre son modèle Gemini Omni dans YouTube Shorts. Cette fonctionnalité permet aux créateurs de générer et de remixer des vidéos à l'aide d'invites textuelles, d'images et audio. Le système est conçu pour gérer automatiquement des montages complexes tout en préservant la cohérence des personnages à travers les scènes. YouTube a mis l'accent sur la protection des créateurs, notamment par des filigranes et des contrôles d'exclusion pour les remix générés par l'IA.
La stratégie de Google avec Spark est distincte de celle de ses concurrents. Alors que l'agent d'OpenAI utilise principalement un navigateur et que Claude Cowork d'Anthropic fonctionne sur le bureau d'un utilisateur, Spark fonctionne via des intégrations d'API structurées avec les propres applications Workspace de Google et des services tiers. Cette approche promet une plus grande fiabilité et une plus grande rapidité que la lecture d'écran, mais elle signifie également que les capacités de Spark sont initialement confinées aux écosystèmes auxquels Google est connecté.
La fiabilité de ces systèmes autonomes reste un défi critique pour l'ensemble de l'industrie. Un agent qui interprète mal l'intention d'un utilisateur pourrait avoir des conséquences importantes, un risque que Google atténue au lancement en exigeant l'approbation explicite de l'utilisateur pour toute transaction financière. Le véritable test pour Gemini Spark n'est pas de savoir s'il peut faire le travail, mais si les utilisateurs lui feront suffisamment confiance pour le laisser faire.
Cet article est uniquement à titre informatif et ne constitue pas un conseil en investissement.