El desarrollador chino de GPU Moore Threads está pasando de vender chips a entregar una infraestructura de IA completa, con el objetivo de capturar un mercado interno que lucha con los controles de exportación de EE. UU.
La empresa china de GPU Moore Threads está implementando una plataforma de IA integral "del cloud al edge", un desafío directo al dominio de Nvidia Corp. en China al ofrecer un sistema integrado de hardware y software diseñado para reducir la barrera para las empresas que migran del ecosistema CUDA de Nvidia.
"El rendimiento de una sola tarjeta es el punto de entrada, pero la capacidad del sistema es lo que influye en la adquisición y la recompra", declararon los materiales de prensa de la compañía para el lanzamiento del 18 de mayo, señalando un giro estratégico de los componentes hacia la entrega de infraestructura de IA integrada.
El lanzamiento incluye el clúster de computación exascale Kua'e, que ya ha sido implementado y logra hasta un 60% de utilización de flops del modelo (MFU) en el entrenamiento de modelos grandes. Se complementa con el MUSA SDK 5.1.0, ahora compatible con CUDA 12.8 de Nvidia y compatible con los 3.194 operadores de PyTorch.
La medida posiciona a Moore Threads para capturar una parte del mercado anual de IA de China, estimado en 50.000 millones de dólares, un segmento donde el acceso de Nvidia se ha visto restringido por las limitaciones de exportación de EE. UU. Si tiene éxito, la estrategia podría acelerar la autosuficiencia de China en IA y desafiar las perspectivas de ingresos a largo plazo de Nvidia en la región, que representaba 17.100 millones de dólares, o el 13% de su total, antes de que se implementaran los controles más estrictos.
De proveedor de GPU a arquitecto de sistemas
El anuncio de Moore Threads marca una evolución estratégica significativa de un proveedor de hardware a un arquitecto de sistemas. La nueva matriz de productos de la compañía se basa en un enfoque de tres vertientes: el clúster Kua’e para el entrenamiento de IA basado en la nube, productos basados en el nuevo SoC Changjiang para dispositivos edge y terminales, y la plataforma MT Lambda para simulación. Esta cartera integrada está diseñada para demostrar a los grandes clientes corporativos que la empresa puede entregar y mantener un flujo de trabajo de IA complejo y de extremo a extremo, un factor crucial para los clientes que emprenden proyectos de IA de varios años.
En el edge, la empresa presentó el módulo E300, basado en el SoC Changjiang, que proporciona 50 TOPS de potencia de computación de IA heterogénea para aplicaciones como inspección industrial, vehículos autónomos y robótica que requieren inferencia local de baja latencia. Al proporcionar una arquitectura unificada desde la nube hasta el borde, Moore Threads tiene como objetivo simplificar la implementación para los desarrolladores que crean aplicaciones de IA híbridas.
Bajando el foso de CUDA
Durante años, el mayor obstáculo para cualquier competidor potencial de Nvidia ha sido CUDA, la plataforma de software patentada de la compañía que se ha arraigado profundamente en la comunidad de desarrollo de IA. Moore Threads está abordando este desafío de frente. Al abrir el código de vLLM-MUSA y lograr soporte nativo en el popular framework SGLang, la empresa está trabajando para minimizar la fricción que enfrentan los desarrolladores al alejarse del ecosistema de Nvidia.
El esfuerzo aborda la "larga cola" de problemas de compatibilidad, como kernels personalizados y dependencias heredadas, que a menudo descarrilan los proyectos de migración. Si bien el soporte para los principales frameworks es un requisito básico, garantizar que todo el esfuerzo de ingeniería histórico de una empresa se pueda portar sin problemas es la verdadera prueba. El enfoque de Moore Threads en su pila de software MUSA, incluida una herramienta de migración automática, es un intento directo de hacer que sus GPU no solo sean utilizables, sino fáciles de adoptar para una comunidad de desarrollo capacitada en gran medida en las herramientas de Nvidia.
Apuntando a la IA física
Quizás el componente más vanguardista del lanzamiento sea la plataforma de simulación MT Lambda, que empuja la narrativa de las GPU de Moore Threads al ámbito de la IA física. A medida que la IA se mueve de los espacios digitales a la interacción con el mundo físico en la robótica y la conducción autónoma, la necesidad de una simulación de alta fidelidad se vuelve primordial. Entrenar estos sistemas en el mundo real es costoso y peligroso.
Moore Threads está posicionando su "GPU de función completa", que integra renderizado de gráficos, simulación física y computación de IA en un solo chip, como la base ideal para este trabajo. Al permitir la generación eficiente de datos sintéticos y la validación de políticas de control en un entorno virtual, la plataforma podría convertirse en una pieza crítica de infraestructura para empresas como Pony.ai y Zhipu AI, ambas listadas como socios. Este movimiento sitúa a Moore Threads no solo frente al hardware de GPU de Nvidia, sino también frente a sus plataformas de simulación integrales como Omniverse.
La estrategia no está exenta de riesgos. Al expandir su alcance de chips a sistemas completos, Moore Threads ahora compite en múltiples frentes: estabilidad de la nube, experiencia del desarrollador y rendimiento de aplicaciones en el mundo real. Sin embargo, dado que las restricciones de EE. UU. crean una apertura potencial para actores nacionales como Huawei y Moore Threads, la oportunidad de integrarse profundamente en el desarrollo de la IA en China puede valer el riesgo.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.