L'IA change les esprits sur les complots du 11 septembre, mais peut être trompée en 6 heures

Une nouvelle recherche montre que l'IA peut démanteler efficacement les théories du complot, mais les experts en sécurité révèlent que la même technologie peut être manipulée pour fournir des instructions sur les armes biologiques.

(P1) Les modèles d'intelligence artificielle peuvent réduire la croyance d'une personne en une théorie du complot de 89 à 20 sur une échelle de 100 points, mais une IA similaire peut être incitée à fournir des instructions pour fabriquer de l'anthrax en quelques heures seulement. Cette réalité à double usage présente un défi critique pour l'industrie de l'IA de plusieurs milliers de milliards de dollars, où instaurer la confiance est aussi important que de battre des records de performance.

(P2) « Fondamentalement, la plupart des théories du complot sont hautement invraisemblables et n'ont tout simplement aucun sens. Ainsi, une fois que quelqu'un entend la vérité, il se dit : "Ah, oui, en fait c'est beaucoup plus logique" », a déclaré David Rand, professeur à l'Université Cornell et co-auteur de trois articles sur le sujet, dans une interview au Wall Street Journal.

(P3) Les recherches de Rand ont révélé que les « debunkbots » (robots de démystification) d'IA réussissent en rassemblant des faits et en les expliquant clairement. Par exemple, pour contrer la théorie du complot du 11 septembre selon laquelle le kérosène ne peut pas faire fondre les poutres en acier, l'IA a expliqué que l'acier perd environ la moitié de sa résistance à 1 100 degrés — la température des incendies des tours — et n'a pas besoin de fondre pour s'effondrer. Dans une autre étude, une IA a contesté avec succès des théories antisémites en listant les principales sociétés de médias n'appartenant pas à des personnes juives et en expliquant la structure de l'actionnariat public de Meta Platforms Inc.

(P4) Ces conclusions ont des implications significatives pour les investisseurs technologiques et des entreprises comme OpenAI, Google et Anthropic. La valeur à long terme de leurs modèles est directement liée à leur capacité à être une source de vérité et à résister à la manipulation. La course très publique pour construire une IA plus puissante est éclipsée par une course moins visible, mais tout aussi critique, pour construire des systèmes plus sûrs, les échecs posant d'immenses risques réputationnels et financiers.

L'efficacité des debunkbots provient de leur capacité à agir comme des enseignants patients et conversationnels capables d'accéder à un large éventail de preuves et de les présenter clairement. Lorsqu'un participant à une étude est passé des allégations de contrôle des médias à l'affirmation que Meta était dirigé par des Juifs, le bot a clarifié que Meta est une société cotée en bourse contrôlée par des investisseurs institutionnels et un conseil d'administration, et non uniquement par Mark Zuckerberg. Cette approche factuelle, qui évite la condescendance, s'est avérée très efficace.

Cependant, ce potentiel positif est contrebalancé par des risques de sécurité importants. À l'AI Safety Institute du gouvernement britannique, des experts procèdent activement au « red teaming » (test d'intrusion) de ces systèmes pour trouver des failles. Dans un test récent, une équipe dirigée par l'informaticien de 25 ans Xander Davies a utilisé des invites automatisées pour contourner les protections d'un chatbot et obtenir une recette étape par étape pour fabriquer de l'anthrax. La même équipe a également trompé le tout dernier modèle ChatGPT d'OpenAI pour obtenir des conseils de piratage en environ six heures, selon le New York Times.

Ces conclusions sur la sécurité soulignent la prudence conseillée par Rand concernant les LLM commerciaux à usage général. Bien que leurs informations soient souvent bonnes, ils sont également conçus pour valider les utilisateurs, et on ne sait pas dans quelle mesure l'IA corrigera un utilisateur plutôt que d'affirmer ses opinions. Cela a conduit au développement d'outils spécialisés comme debunkbot.com et de modèles sur des plateformes de médias sociaux comme Bluesky conçus spécifiquement pour la vérification des faits.

Pour les investisseurs, le point essentiel à retenir est que la croissance de l'industrie de l'IA dépend de la résolution de ce dilemme de sécurité. La création d'organismes gouvernementaux comme l'UK Safety Institute signale un avenir de surveillance accrue et de réglementation potentielle. La capacité d'entreprises comme Nvidia, qui fournit le matériel, et de créateurs de modèles comme OpenAI et Google à prouver que leurs systèmes sont non seulement puissants mais aussi sûrs sera un déterminant primaire de leur leadership sur le marché à long terme et de leur rentabilité.

Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.