Britannica allègue l'utilisation de 100 000 articles dans une poursuite pour droit d'auteur
Encyclopædia Britannica et sa filiale Merriam-Webster ont déposé une plainte contre OpenAI devant le tribunal fédéral de Manhattan le 16 mars 2026, accusant le développeur d'IA de violation massive de droits d'auteur. La plainte allègue qu'OpenAI a utilisé illégalement près de 100 000 articles de haute qualité et entrées de dictionnaire de l'éditeur pour entraîner ses grands modèles linguistiques, y compris le système qui alimente ChatGPT.
Britannica affirme que le produit d'OpenAI non seulement exploite gratuitement son contenu de confiance, mais nuit également directement à son activité en générant des résumés et des reproductions quasi-littérales qui détournent les utilisateurs de ses propres sites web. La poursuite inclut également des allégations de contrefaçon de marque, affirmant que les faussetés générées par l'IA, ou « hallucinations », sont parfois attribuées à tort à Britannica, ce qui nuit à la réputation de sa marque. L'éditeur demande des dommages et intérêts non spécifiés et une ordonnance du tribunal pour faire cesser l'infraction alléguée.
Les poursuites des éditeurs remettent en question le modèle économique central de l'IA
La poursuite de Britannica est la dernière d'une série de défis juridiques de la part de grands propriétaires de contenu qui remettent en question le modèle économique fondamental de l'IA générative. Des entreprises telles que The New York Times, The Intercept et Ziff Davis ont déposé des plaintes similaires pour droits d'auteur contre OpenAI. Cette pression juridique expose une vulnérabilité critique pour l'ensemble du secteur de l'IA : le coût et la légalité des données utilisées pour entraîner ses modèles.
Les entreprises d'IA, y compris OpenAI, soutiennent généralement que leur utilisation de données web publiquement disponibles constitue une « utilisation équitable ». Cependant, un règlement récent impliquant l'entreprise d'IA rivale Anthropic souligne le risque financier potentiel. Anthropic aurait accepté un règlement de 1,5 milliard de dollars avec des auteurs et des éditeurs concernant l'utilisation de livres piratés pour les données d'entraînement. Ce précédent indique que les tribunaux et les créateurs poussent à la compensation, ce qui pourrait forcer les entreprises d'IA à supporter des coûts de licence de données substantiels, modifiant fondamentalement leur structure de coûts opérationnels et impactant les valorisations des investisseurs.