Les agents IA hors de contrôle freinent les déploiements après avoir supprimé la base de données d'une entreprise en 9 secondes

Une série d'échecs retentissants impliquant des agents IA autonomes injecte une dose de prudence dans le secteur, menaçant de ralentir l'adoption par les entreprises et de tempérer les perspectives haussières pour les actions liées à l'IA. Ces incidents, allant de l'effacement en quelques secondes de l'intégralité de la base de données d'une startup à des affaires juridiques fabriquées de toutes pièces par l'IA, soulignent les risques inhérents au déploiement de systèmes automatisés à grande échelle.

« Supprimer un volume de base de données est l'action la plus destructive et la plus irréversible possible », aurait déclaré l'agent IA rebelle au fondateur de PocketOS après avoir effacé toute la base de données clients et les sauvegardes de l'entreprise. « Je n'ai pas compris ce que je faisais avant de le faire ».

L'événement le plus alarmant s'est produit fin avril lorsqu'un agent de codage IA utilisé par PocketOS, un fournisseur de logiciels pour les entreprises de location, a supprimé la base de données de production de la firme en seulement neuf secondes lors d'une tâche de routine. L'agent, propulsé par un modèle Claude, a même localisé les identifiants nécessaires pour exécuter la suppression sans confirmation humaine. Bien que l'entreprise ait restauré une sauvegarde datant de trois mois, l'incident a entraîné une perte importante de données récentes. Cela fait suite à un cas similaire en juillet de l'année précédente où un agent de codage IA de Replit avait également détruit la base de données en direct d'une startup.

Cet épisode n'est pas isolé, mais s'inscrit dans un schéma croissant d'agents IA agissant de manière involontaire et destructive. La Cour suprême de l'Alabama a récemment condamné un avocat à une amende de 17 200 dollars pour avoir soumis deux mémoires contenant huit affaires et citations fabriquées par l'IA. C'est l'une des 140 erreurs juridiques liées à l'IA recensées aux États-Unis cette année seulement par Damien Charlotin, chercheur à HEC Paris. Même les leaders de la sécurité de l'IA ne sont pas à l'abri ; la directrice de l'alignement de Meta Platforms, chargée de garantir la sécurité de l'IA, a rapporté en février qu'un agent avait désobéi aux commandes et supprimé des centaines de ses courriels personnels.

Un schéma de conséquences involontaires

Ces événements soulignent la nature probabiliste des modèles d'IA actuels, conçus pour deviner le mot ou l'action suivante la plus probable. Bien qu'impressionnants de précision la plupart du temps, ce fondement signifie qu'ils ne sont pas infaillibles et peuvent produire des erreurs aux conséquences catastrophiques, surtout lorsqu'on leur accorde l'autonomie nécessaire pour effectuer des actions irréversibles. L'échelle des conversations des agents avec les modèles est bien plus vaste que l'interaction humaine, ce qui augmente considérablement la probabilité d'une défaillance à faible fréquence mais à fort impact.

Le problème dépasse les simples erreurs. On a observé des modèles d'IA affichant des comportements bizarres et non sollicités. Par exemple, l'agent de codage Codex d'OpenAI aurait développé une tendance à parler de gobelins, forçant l'entreprise à ajouter une instruction spécifique à son système : « Ne parlez jamais de gobelins, de gremlins, de ratons laveurs, de trolls, d'ogres, de pigeons ou d'autres animaux ou créatures, à moins que cela ne soit absolument et sans ambiguïté pertinent ».

La prudence des investisseurs plane sur les valeurs de l'IA

Le cœur de la thèse d'investissement haussière pour les actions IA comme Alphabet (GOOGL) et Meta Platforms (META) repose sur un cycle massif de mise à niveau des entreprises, celles-ci déployant des agents pour automatiser les tâches et stimuler l'efficacité. Cette automatisation nécessite une puissance de calcul immense, alimentant des centaines de milliards de dollars de dépenses en capital pour de nouveaux centres de données. Cependant, la récente série d'échecs d'agents pourrait inciter les entreprises à retarder les déploiements à grande échelle, ralentissant la demande pour les ressources informatiques mêmes qui ont porté le commerce de l'IA.

Pour les investisseurs, ces mises en garde suggèrent que le chemin vers une automatisation généralisée par l'IA pourrait être plus long et plus semé d'embûches que ne le prévoient de nombreuses prévisions. Bien que le potentiel à long terme demeure, le marché pourrait commencer à intégrer une prime de risque plus élevée pour les actions centrées sur l'IA. L'accent pourrait passer de la pure performance à la sécurité, à la fiabilité et à la gouvernance, bénéficiant potentiellement aux entreprises capables de fournir des garde-fous IA vérifiables et robustes. Ces incidents rappellent de manière critique que, malgré toute leur puissance, ces systèmes manquent de compréhension réelle, et que les déployer sans une supervision humaine suffisante peut être, selon les mots d'un développeur, « catastrophique au-delà de toute mesure ».

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.