L'ancien responsable de Qwen admet : « Nous n'avons pas tout fait correctement »
Dans sa première déclaration publique depuis son départ d'Alibaba, Lin Junyang, ancien responsable de l'IA Qwen, a offert une critique franche de l'orientation technique passée de l'équipe. Il a ouvertement admis : « Nous n'avons pas tout fait correctement », ciblant spécifiquement la tentative ambitieuse de fusionner les modes « pensée » et « instruction » en un seul modèle. Cette stratégie a été la plus publiquement tentée avec le modèle Qwen3.
Lin a expliqué que l'approche hybride a créé un système compromis. La fonction « pensée » est devenue verbeuse et hésitante, tandis que la fonction « instruction » a perdu sa directivité et sa fiabilité, devenant finalement plus coûteuse. Cette évaluation est étayée par les actions ultérieures d'Alibaba au second semestre 2025, lorsque la mise à jour de la version 2507 a publié des modèles « Instruction » et « Pensée » séparés et dédiés. Lin soutient que si la combinaison des modes semble conceptuellement solide, la difficulté pratique à concilier leurs différentes exigences en matière de données et leurs objectifs comportementaux a fait de la séparation une voie plus attrayante et efficace pour le déploiement commercial.
La « pensée agentique » considérée comme la prochaine évolution de l'IA
Lin estime que l'ère de la « pensée raisonnée », exemplifiée par des modèles comme o1 d'OpenAI et DeepSeek-R1, a largement accompli sa mission. Ces modèles ont prouvé que le raisonnement complexe pouvait être entraîné et mis à l'échelle. La question critique maintenant, pose-t-il, est de savoir ce qui vient ensuite. Sa réponse est un changement fondamental vers la « pensée agentique » – passant de simplement « penser plus longtemps » à « penser pour agir ».
Ce nouveau paradigme se concentre sur l'entraînement d'agents IA capables d'opérer en boucle fermée avec leur environnement. Les distinctions clés de la pensée agentique incluent la capacité de décider quand arrêter de penser et d'agir, de sélectionner et de séquencer les outils, de traiter les retours bruyants du monde réel et de réviser les plans après un échec. Cela déplace l'objectif de la production d'une réponse finale et statique vers le maintien d'une action efficace et continue dans un environnement dynamique. Le but n'est plus seulement une réponse correcte, mais une résolution de problèmes robuste et efficace par l'interaction.
Le marché plus large adopte la « pensée pour agir »
La vision de Lin s'aligne sur une tendance de marché plus large où la valeur de l'IA est mesurée par son utilité dans le monde réel. Le concept gagne en traction commerciale, comme en témoigne le lancement du « Thinking Lab » par des startups comme Globeholder AI. L'entreprise définit son approche comme l'« Intelligence de Type 2 » – des systèmes capables d'analyse structurée et de test d'hypothèses – ce qui reflète directement la description de Lin du raisonnement orienté objectif.
Cette évolution stratégique se déroule alors que les modèles open source chinois, y compris Qwen d'Alibaba et DeepSeek, défient rapidement la domination des systèmes propriétaires occidentaux comme ChatGPT. Selon un rapport du Congrès de mars 2026, les modèles chinois représentent une part croissante des téléchargements et de l'utilisation mondiaux. Le plaidoyer de Lin en faveur d'un nouveau cadre d'IA, venant d'une figure clé derrière l'un des projets open source les plus réussis de Chine, fournit une feuille de route stratégique pour la façon dont les développeurs peuvent créer des applications plus pratiques et puissantes, intensifiant la concurrence mondiale pour définir l'avenir de l'intelligence artificielle.