Le modèle de génération vidéo HappyHorse 1.1 d'Alibaba Group ajoute la sortie audio et la prise en charge de la référence de personnage sur neuf images, avec des améliorations portant sur l'expressivité dynamique, la cohérence du sujet et la qualité visuelle par rapport à la version 1.0.
La mise à jour « optimise la modélisation du mouvement et la cohérence temporelle pour renforcer la cohérence des actions », a déclaré Alibaba, tout en permettant l'entrée simultanée de jusqu'à neuf images de référence de personnage pour une meilleure compréhension multi-plan et le respect des instructions.
HappyHorse 1.1 offre des améliorations à l'échelle du système dans l'expressivité dynamique, la cohérence du sujet, le respect des instructions, la qualité visuelle et les capacités audio — cinq dimensions améliorées par rapport à la version 1.0. Le modèle est désormais intégré au site officiel HappyHorse, à Alibaba Cloud Bailian et à Qwen Cloud, donnant aux développeurs et aux clients entreprises un accès direct via l'infrastructure cloud d'Alibaba.
Cette mise à niveau renforce la position concurrentielle d'Alibaba dans la génération vidéo par IA, un marché où ByteDance, Kuaishou et Tencent ont également lancé des modèles concurrents. Alibaba a engagé plus de 380 milliards de yuans (52,5 milliards de dollars) de dépenses d'investissement, les dirigeants signalant que le chiffre final pourrait dépasser les plans initiaux alors que l'entreprise s'engage dans une course pour construire l'infrastructure informatique nécessaire aux charges de travail d'IA.
HappyHorse 1.1 entre sur un marché très fréquenté des modèles chinois de vidéo par IA. Jimeng de ByteDance, Kling de Kuaishou et VideoCrafter de Tencent ont tous lancé des capacités de génération vidéo au cours de l'année écoulée, chacun cherchant à séduire les développeurs et à décrocher des contrats d'entreprise. L'avantage d'Alibaba réside dans sa distribution cloud — HappyHorse est intégré nativement à Alibaba Cloud Bailian, la plateforme d'IA de l'entreprise qui sert plus de 400 000 clients entreprises.
L'ajout de la génération audio est une fonctionnalité différenciante. La plupart des modèles de génération vidéo des concurrents chinois produisent une sortie silencieuse, nécessitant des pipelines audio séparés. La génération audio-vidéo de bout en bout de HappyHorse 1.1 réduit la complexité des workflows pour les créateurs de contenu et les équipes marketing, accélérant potentiellement l'adoption par les entreprises.
Les actions Alibaba se négocient à environ 10 fois les bénéfices anticipés, une décote par rapport aux 15 fois de Tencent et une prime par rapport au Hang Seng Index. La mise à niveau de HappyHorse à elle seule est peu susceptible de faire bouger le titre, mais elle renforce le récit d'Alibaba en tant que leader de l'IA à un moment où l'entreprise dépense agressivement dans les infrastructures. Alibaba Cloud, qui héberge le modèle, a généré 69 milliards de yuans de revenus au cours de l'exercice 2025, les revenus liés à l'IA affichant une croissance à trois chiffres. Le risque : la génération vidéo par IA reste un marché naissant aux voies de monétisation incertaines. Sora d'OpenAI n'a pas encore été lancé publiquement, et aucun concurrent n'a démontré de revenus durables provenant d'outils de génération vidéo.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.