Qwen 3.5 Omni traite les vidéos 800% plus vite que ses concurrents
Alibaba a lancé son modèle Qwen 3.5 Omni le 30 mars 2026, marquant son deuxième lancement majeur d'IA en seulement six semaines. L'innovation clé du modèle est son architecture native "omnimodale", qui lui permet de traiter simultanément du texte, des images, de l'audio et de la vidéo en un seul passage. Entraîné sur plus de 100 millions d'heures de données audiovisuelles, Qwen évite les flux de travail multi-étapes plus lents utilisés par ses rivaux. Lors d'une démonstration, Qwen 3.5 Omni a analysé un clip vidéo YouTube en environ une minute. En revanche, un système non omnimodal comme ChatGPT 5.4 a nécessité neuf minutes pour accomplir la même tâche en combinant des outils séparés pour la vision, la transcription audio et la reconnaissance de texte.
Le nouveau modèle surpasse ElevenLabs dans 20 langues
Qwen 3.5 Omni introduit plusieurs nouvelles capacités qui ciblent des segments de marché spécifiques. Une fonctionnalité de clonage vocal permet au modèle d'adopter la voix d'un utilisateur à partir d'un échantillon, le plaçant en concurrence directe avec des plateformes spécialisées comme ElevenLabs. Sur les bancs d'essai de stabilité vocale multilingues, Qwen 3.5 Omni-Plus a surpassé ElevenLabs et GPT-Audio dans 20 langues différentes. Les capacités de reconnaissance vocale du modèle se sont également considérablement étendues pour couvrir 113 langues et dialectes, contre 19 dans la version précédente. De plus, il intègre désormais la recherche web en temps réel et une nouvelle fonctionnalité "Audio-Visual Vibe Coding", qui lui permet d'écrire du code fonctionnel en se basant uniquement sur l'observation d'un enregistrement d'écran d'une tâche.
Alibaba accélère les sorties de produits tandis que ses rivaux se concentrent sur la politique
Le calendrier de sortie agressif d'Alibaba met en lumière une divergence stratégique sur le marché mondial de l'IA. Alors que des concurrents comme OpenAI et Anthropic se concentrent publiquement sur le développement de cadres éthiques et de documents de gouvernance, tels que le "Model Spec" et la "Claude Constitution", Alibaba exécute une stratégie rapide et axée sur les produits. En lançant deux modèles de pointe en moins de deux mois, l'entreprise priorise le déploiement de fonctionnalités tangibles et de gains de performance pour conquérir des parts de marché. Cette approche contraste avec les discussions plus philosophiques et axées sur les politiques qui dominent le discours chez certains de ses principaux concurrents américains, signalant une voie différente dans la course à la domination de l'IA.