Le dernier modèle vidéo d'Alibaba vise à capturer le flux de travail créatif de bout en bout, un défi direct aux capacités de Sora d'OpenAI, encore non disponible.
Retour
Le dernier modèle vidéo d'Alibaba vise à capturer le flux de travail créatif de bout en bout, un défi direct aux capacités de Sora d'OpenAI, encore non disponible.

(P1) Alibaba Group Holding (9988.HK) a lancé sa version améliorée du modèle de génération Wanxiang 2.7-Video, intensifiant la course à l'intelligence artificielle avec un défi direct au très attendu Sora d'OpenAI. Le nouveau modèle prend en charge des entrées multimodales, notamment du texte, des images et de l'audio, en se concentrant sur l'ensemble du flux de travail créatif, de la génération aux modifications finales. Cet ensemble de fonctionnalités est conçu pour lui donner un avantage pratique sur le marché en pleine croissance de la vidéo générative.
(P2) « Le modèle se concentre sur l'ensemble du flux de travail créatif, couvrant des processus tels que la génération, l'édition, la réplication, le remodelage, le pilotage, la continuation et le référencement », a déclaré l'entreprise dans son annonce. Cet accent mis sur un outil complet et tout-en-un suggère une stratégie axée sur la convivialité et le contrôle du créateur, et pas seulement sur la puissance de génération brute.
(P3) Wan 2.7-Video permet aux utilisateurs d'apporter des ajustements localisés aux scènes vidéo avec des commandes simples, les zones éditées s'intégrant parfaitement au métrage original. Il prend en charge l'ajout ou la suppression d'éléments, le remplacement d'objets et la modification d'attributs basés sur des instructions textuelles ou des images de référence. Par exemple, un arrière-plan peut être changé de l'été à l'automne, ou le style complet de la vidéo converti en feutre de laine, tout en maintenant les mouvements des personnages. Ce niveau de contrôle granulaire et de transformation de style est un différenciateur clé.
(P4) Ce lancement met la pression sur des rivaux tels qu'OpenAI et Google pour démontrer non seulement des capacités de génération impressionnantes, mais aussi une voie claire vers un produit convivial et commercialement viable. Pour Alibaba, un modèle vidéo réussi pourrait considérablement renforcer l'attrait de sa division cloud, offrant un nouvel outil puissant pour attirer et fidéliser les clients entreprises. L'action de la société, qui a connu un intérêt vendeur important avec un ratio de 62,85 %, pourrait voir un regain d'intérêt de la part des investisseurs si le modèle prouve sa valeur commerciale.
L'entrée d'Alibaba dans l'espace de la vidéo générative haut de gamme avec Wan 2.7-Video est une étape importante pour le géant technologique chinois. Alors que le Sora d'OpenAI a captivé l'imagination du public avec sa génération de vidéo hyper-réaliste, il n'est toujours pas accessible au public. L'accent mis par Alibaba sur un flux de travail complet, de la génération initiale à l'édition détaillée, pourrait lui donner l'avantage du premier arrivant dans l'application pratique de cette technologie. La capacité du modèle à effectuer du « in-painting » et du « out-painting » de vidéo, ainsi que la cohérence du style et des personnages, sont des fonctionnalités que les créateurs professionnels réclament.
Les capacités multimodales du modèle, acceptant du texte, des images, de la vidéo et de l'audio comme entrées, en font un outil polyvalent pour une large gamme d'applications créatives. Par exemple, un utilisateur pourrait fournir un court clip vidéo, une image de référence pour le style et une invite textuelle pour modifier le contenu de la scène, le tout dans le même flux de travail. Cette approche intégrée contraste avec les chaînes d'outils plus fragmentées que les créateurs utilisent actuellement, qui impliquent souvent plusieurs logiciels pour différentes tâches.
Le marché de l'IA générative devient de plus en plus encombré, avec des acteurs technologiques majeurs et des startups bien financées se disputant la domination. Wan 2.7-Video d'Alibaba sera en concurrence non seulement avec Sora d'OpenAI, mais aussi avec les offres de Google, Meta et de startups comme Runway et Pika. Le principal champ de bataille ne sera probablement pas seulement la qualité de la vidéo générée, mais aussi la facilité d'utilisation, la rentabilité et l'intégration avec les flux de travail créatifs existants.
Pour Alibaba, le succès de Wan 2.7-Video est stratégiquement important. Il offre une démonstration puissante de ses capacités en IA, ce qui peut aider à stimuler l'adoption de ses services de cloud computing plus larges. L'entreprise a investi massivement dans l'IA, et ce lancement est un signal clair de son ambition d'être un leader mondial dans le domaine. Le modèle sera une offre clé pour ses clients entreprises dans l'e-commerce, la publicité et le divertissement, qui recherchent de nouvelles façons de créer du contenu attrayant à grande échelle. La mention d'un objectif de cours de 199 $ de la part de Citi pour BABA-W (09988.HK) suggère que certains analystes voient un potentiel de hausse significatif, et de nouveaux produits IA comme celui-ci pourraient être un facteur clé pour réaliser ce potentiel.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.