Alibaba Group Holding (09988.HK) a lancé son modèle de génération Wan 2.7-Video amélioré, un nouvel outil prenant en charge quatre entrées multimodales : texte, images, vidéo et audio. Le modèle se concentre sur l'intégration de l'ensemble du flux de travail créatif, de la génération à l'édition, positionnant Alibaba pour rivaliser plus vigoureusement dans le secteur de la vidéo par IA générative contre des acteurs établis comme OpenAI et Google.
« Le modèle prend en charge des entrées multimodales incluant le texte, les images, la vidéo et l'audio, et se concentre sur l'intégralité du flux de travail créatif », a déclaré la société dans son annonce. Cette approche intégrée vise à offrir une contrôlabilité et une polyvalence accrues aux créateurs de contenu, abaissant potentiellement la barrière à l'entrée pour une production vidéo de haute qualité.
Le modèle Wan 2.7-Video permet aux utilisateurs d'effectuer des ajustements localisés sur des scènes vidéo via des commandes, les zones éditées s'intégrant naturellement dans les images originales en termes de luminosité et de texture. Il permet également d'ajouter ou de supprimer des éléments, de remplacer des objets et de modifier leurs attributs en fonction d'instructions textuelles ou d'images de référence. Par exemple, un arrière-plan peut passer de l'été à la fin de l'automne, ou le style complet d'une vidéo peut être converti en une esthétique de feutre de laine d'une seule commande, démontrant un haut degré de contrôle créatif.
Ce lancement intensifie la concurrence sur le marché de la génération de vidéos par IA, où des entreprises comme OpenAI avec son modèle Sora ont démontré de puissantes capacités de conversion de texte en vidéo. Pour Alibaba, le succès du modèle Wan 2.7-Video pourrait stimuler une croissance significative pour sa division de cloud computing et renforcer sa position globale dans la course mondiale à l'IA. Les actions de la société cotées à Hong Kong (09988.HK) pourraient voir l'intérêt des investisseurs croître si la technologie trouve une application commerciale forte.
L'accent sur la post-production
Un différenciateur clé pour Wan 2.7-Video semble être son accent sur la chaîne de production de bout en bout, allant au-delà de la simple génération. Alors que ses concurrents se sont concentrés sur la création initiale de vidéos à partir d'invites textuelles, l'outil d'Alibaba fournit une suite de capacités d'édition conçues pour la post-production. Les utilisateurs peuvent insérer précisément du contenu basé sur des images de référence, améliorer la qualité vidéo et même ajuster les styles de prise de vue, comme changer les angles de caméra ou appliquer différents effets visuels. Cela pourrait réduire le besoin de multiples logiciels complexes et coûteux, rationalisant ainsi le processus de création de contenu pour les professionnels comme pour les amateurs.
La capacité du modèle à effectuer des « transformations environnementales et stylistiques tout en conservant les mouvements des personnages inchangés » est une caractéristique technique majeure. Cela permet une flexibilité créative sans nécessiter un rendu complet des éléments de base de la vidéo. Par exemple, les vêtements d'un personnage pourraient être changés, ou la météo d'une scène modifiée, tout en préservant le mouvement original du personnage. Cette capacité pourrait permettre d'économiser beaucoup de temps et de ressources informatiques dans la production de films, de publicités et de contenus pour les réseaux sociaux.
Implications concurrentielles et de marché
La sortie de Wan 2.7-Video place Alibaba en concurrence directe avec d'autres grandes entreprises technologiques investissant massivement dans l'IA générative. L'ensemble complet de fonctionnalités du modèle suggère qu'Alibaba ne vise pas seulement la parité, mais tente de se tailler une place dans les flux de travail créatifs professionnels et semi-professionnels. L'impact potentiel sur la division cloud d'Alibaba est substantiel ; les modèles d'IA avancés sont un moteur majeur de la consommation de services cloud, et un outil vidéo populaire pourrait attirer une nouvelle vague de clients vers Alibaba Cloud.
D'un point de vue investissement, le succès de Wan 2.7-Video est une composante critique de la stratégie globale d'Alibaba en matière d'IA. Le marché mondial de l'IA générative devrait dépasser 1,3 billion de dollars d'ici 2032, selon Bloomberg Intelligence, et la génération de vidéos est l'un de ses fronts les plus visibles et les plus compétitifs. En proposant un outil polyvalent qui traite à la fois la génération et l'édition, Alibaba fait un pari stratégique pour capturer une part significative de ce marché en expansion. La réaction du marché dépendra probablement des tests de référence indépendants et des comparaisons avec les modèles rivaux, qui n'ont pas encore été publiés.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.