Nous Research a obtenu 50 millions de dollars lors d'un tour de financement de série A avec une valorisation de jeton d'un milliard de dollars, accélérant son développement d'IA décentralisée et renforçant le secteur émergent de l'IA open source.
Aperçu financier et investissements stratégiques
Nous Research, un collectif d'intelligence artificielle décentralisé, a annoncé un tour de financement de série A de 50 millions de dollars, mené par Paradigm, valorisant le projet à 1 milliard de dollars en jetons. Cet investissement porte le financement total de Nous Research à plus de 70 millions de dollars, après un tour de table de 5,2 millions de dollars en janvier 2024 et un tour de table de 14,8 millions de dollars en janvier 2025. Parallèlement, Pluralis Research, une autre entité axée sur l'entraînement de l'IA décentralisée, a récemment clôturé un tour de financement de démarrage de 7,6 millions de dollars co-dirigé par USV et CoinFund.
Stratégie IA décentralisée et innovations techniques
Nous Research se consacre au développement de modèles de langage de grande taille (LLM) open source et centrés sur l'humain, ainsi qu'aux infrastructures de soutien. L'organisation utilise la blockchain Solana pour coordonner les ressources informatiques mondiales pour l'entraînement distribué, visant à démocratiser l'accès aux capacités d'IA avancées et à favoriser la transparence et la propriété communautaire. Son modèle phare, Hermes 3, est construit sur les architectures LLaMA et Mistral.
Karan Malhotra, cofondateur de Nous Research, a déclaré : "> Nous pensons que l'avenir de l'IA se situe à l'intersection du développement open source et de l'éthos crypto." L'intégration de la technologie blockchain vise à garantir la transparence, à inciter à la participation et à atténuer l'empoisonnement des données.
Pluralis Research est à l'avant-garde d'une nouvelle approche appelée Apprentissage par Protocole, qui permet des exécutions d'entraînement collaboratives et multipartites pour les modèles fondamentaux sans qu'une seule entité ne contrôle l'intégralité des poids du modèle. Alexander Long, fondateur et PDG de Pluralis Research, a souligné : "> Pluralis ouvre la voie à une véritable propriété collective au niveau du modèle, en entraînant des modèles fondamentaux qui sont répartis sur des appareils géographiquement séparés, connectés uniquement par Internet."
Les avancées techniques sont cruciales pour l'entraînement distribué de l'IA. Celles-ci incluent des optimiseurs efficaces en communication tels que DeMo, DisTrO, OpenDiLoCo, SparseLoCo et Skip-Pipe, ainsi que diverses approches de parallélisme. Nous Research a rapporté des avancées, notamment un cadre qui prétend réduire les besoins de transmission de données de 3 000 fois pour le pré-entraînement et potentiellement jusqu'à 10 000 fois pour le post-entraînement sans dégrader les performances du modèle. L'approche DiLoCo de DeepMind, basée sur la moyenne fédérée, minimise la communication en permettant à chaque unité GPU d'entraîner son modèle indépendamment avant de synchroniser les mises à jour de poids.
Impact plus large sur le marché et considérations éthiques
Les avancées en matière d'entraînement d'IA décentralisée par des projets comme Nous Research et Pluralis Research signifient une potentielle refonte du développement de l'IA. En démocratisant l'accès au calcul d'entraînement et en favorisant les modèles open source, ces initiatives remettent en question le contrôle centralisé historiquement détenu par les grands laboratoires d'IA tels que OpenAI, Anthropic, Meta, Google et xAI. Ce changement pourrait entraîner de nouveaux modèles crypto-économiques et des changements de marché significatifs dans l'infrastructure et les applications de l'IA.
L'adoption de systèmes décentralisés et sans permission introduit de nouvelles complexités concernant la gouvernance, les biais et la responsabilité de l'IA. Les cadres réglementaires traditionnels sont souvent inadaptés aux agents autonomes fonctionnant sur un réseau mondial et distribué. De nouveaux modèles de gouvernance émergent, les Organisations Autonomes Décentralisées (DAO) servant de mécanisme principal pour la gouvernance de l'IA on-chain, utilisant des contrats intelligents pour des structures transparentes et participatives. Des architectures hybrides, qui effectuent des calculs intensifs hors chaîne tout en utilisant la blockchain comme un registre immuable et vérifiable, sont également explorées. Par exemple, OORT a introduit DataHub Launchpad, une plateforme pour la collecte de données d'IA participative, qui récompense les contributeurs avec des jetons, favorisant à la fois la croissance de la communauté et la génération de données pour les équipes d'IA.