MiniMax a dévoilé lundi son modèle phare M3, revendiquant des performances de codage de premier ordre qui surpassent GPT-5.5 sur le benchmark SWE-Bench Pro, alors que la startup chinoise d'IA poursuit une cotation secondaire sur le STAR Market de Shanghai après que ses actions à Hong Kong aient grimpé de 409 % depuis janvier.
Selon un communiqué de MiniMax, le modèle devance OpenAI GPT-5.5 et Google Gemini 3.1 Pro sur SWE-Bench Pro, un benchmark mesurant les tâches d'ingénierie logicielle du monde réel, et ne se classe derrière que Anthropic Claude Opus 4.7. Sur Claw-Eval, une évaluation de bout en bout pour agents autonomes, le M3 a obtenu le score le plus élevé parmi tous les modèles testés.
« Le M3 est le seul modèle open source qui offre simultanément des capacités de codage de pointe, des fenêtres de contexte d'un million de tokens et un traitement multimodal natif », a déclaré MiniMax dans son annonce.
Trois arbres technologiques, un seul modèle
Le M3 introduit MiniMax Sparse Attention, ou MSA, une nouvelle architecture d'attention conçue pour résoudre le coût de calcul quadratique du traitement de longs contextes. Le mécanisme utilise une approche en deux étapes : une étape légère d'Index Attention sélectionne les blocs KV les plus pertinents via un max pooling par blocs, suivie d'un calcul d'attention sparse complet uniquement sur ces blocs. À 1 million de tokens, le calcul par token du M3 est d'un vingtième de celui de son prédécesseur, avec une vitesse de préremplissage multipliée par 9,7 et une vitesse de décodage multipliée par 15,6, selon MiniMax.
La société a indiqué que le M3 a été entraîné sur des données texte-image entrelacées dès la première étape de pré-entraînement, le pipeline de données ayant été reconstruit pour traiter jusqu'à 100 billions de tokens. MiniMax a open-sourcé les modèles M2.5 et M2.7 plus tôt cette année et a précisé que les poids du M3 et le rapport technique suivront dans les 10 jours.
Pour démontrer les capacités combinées du modèle, MiniMax a chargé le M3 de reproduire de manière indépendante un article primé du prix du meilleur article remarquable de l'ICLR 2025 sur la dynamique d'apprentissage lors du fine-tuning. Le modèle a fonctionné pendant environ 12 heures sans intervention humaine, produisant 18 commits et 23 graphiques expérimentaux. Il a reproduit avec succès les expériences clés de l'article, y compris l'effet de resserrement observé dans l'entraînement DPO et l'efficacité de la méthode d'atténuation Extend proposée.
Dans un test séparé, le M3 a optimisé un noyau de multiplication matricielle FP8 sur l'architecture Hopper de Nvidia, à partir d'un squelette Triton non fonctionnel. Sur 24 heures, le modèle a soumis 147 benchmarks et 1 959 appels d'outils, faisant passer l'utilisation maximale du matériel Hopper FP8 de 7,6 % à 71,3 % — une accélération d'un facteur 9,4. La plupart des modèles concurrents ont cessé de progresser en moins de 30 soumissions ; le résultat optimal du M3 est intervenu à la soumission 145.
Momentum de l'introduction en bourse et contexte financier
Le lancement du modèle intervient quelques jours après que MiniMax a déposé un rapport de conseil en cotation auprès de la CSRC de Shanghai le 29 mai, initiant son processus d'introduction en bourse en actions A avec CITIC Securities comme conseiller. La société est entrée en bourse à Hong Kong en janvier à 165 HK$ par action, levant environ 619 millions de dollars. Son action a clôturé à 840 HK$ le 29 mai, valorisant la société à 263,45 milliards HK$, soit environ 33,8 milliards de dollars.
Le revenu récurrent annualisé de MiniMax a dépassé 300 millions de dollars fin mai, plus que doublant en deux mois, selon des indicateurs commerciaux divulgués le 28 mai. La société a déclaré un chiffre d'affaires 2025 de 79 millions de dollars avec une marge brute de 25,4 % et une perte nette ajustée de 250 millions de dollars. Elle compte plus d'un million de clients entreprises et développeurs et environ 300 millions d'utilisateurs mondiaux.
La cotation à Shanghai donnerait à MiniMax un accès à des marchés de capitaux nationaux plus profonds à un moment où Pékin a signalé qu'elle souhaitait que ses champions de l'IA soient financés localement. La société rejoint ses pairs, dont Zhipu et Moonshot, dans la poursuite de cotations publiques alors que le secteur chinois de l'IA s'efforce de convertir sa crédibilité technique en capital boursier.
Les actions de MiniMax, en hausse de plus de 400 % par rapport à leur prix d'introduction en bourse, se négocient avec une prime significative par rapport à la plupart des pairs mondiaux de l'IA. La société rejoindra l'indice Hang Seng Tech le 8 juin. La question de savoir si les performances du M3 sur les benchmarks peuvent soutenir cette valorisation — et si la cotation sur le STAR Market se poursuit à des conditions similaires — dépendra de la capacité du modèle à convertir les victoires techniques en revenus d'entreprise à grande échelle.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.