La próxima fiebre del oro de la IA: 3 'palas' de datos para el auge de la IA encarnada

Un cambio de paradigma de la IA basada en el lenguaje a los 'modelos mundiales' físicamente interactivos está creando un auge de inversión en la infraestructura de datos subyacente necesaria para entrenarlos. El principal cuello de botella para la IA encarnada (Embodied AI) ya no son los algoritmos sino una inmensa brecha de datos, con una demanda que está creciendo hasta la escala de los exabytes, según un nuevo informe de Guotai Haitong. Esto posiciona a las empresas de recopilación, simulación y procesamiento de datos como la apuesta central de 'picos y palas' para la próxima ola de inteligencia artificial.

'Las empresas que primero llenen esta brecha de datos actuarán como los 'vendedores de palas' de la era de la IA física, obteniendo primas de valoración significativas', afirmó el informe de Guotai Haitong.

Los requisitos de datos para la inteligencia encarnada son órdenes de magnitud mayores que para los grandes modelos de lenguaje (LLM). Mientras que los LLM se entrenan en conjuntos de datos de texto e imagen a escala de petabytes, los robots que interactúan con el mundo requieren datos a escala de exabytes que incluyan la física de la interacción: fuerza, tacto y fricción. Estos datos especializados y de alta calidad son críticamente escasos, lo que crea un cuello de botella fundamental para toda la industria robótica.

Esta escasez está obligando a una reevaluación de la cadena de valor de la robótica. El enfoque se está desplazando del hardware robótico en sí a los proveedores de infraestructura de datos que pueden resolver el problema de recopilación y procesamiento. Esta tendencia podría desencadenar una entrada significativa de capital en un nuevo subsector de acciones de IA centrado en herramientas y servicios de datos, beneficiándolos potencialmente más que a los fabricantes de robots a corto plazo.

El dilema de los datos de un billón de dólares: 3 soluciones en competencia

Para cerrar la brecha de datos, la industria está siguiendo tres caminos principales, cada uno con distintas ventajas y desventajas:

Datos del mundo real: Recopilados a través de equipos de teleoperación operados por humanos y trajes de captura de movimiento, este método proporciona los datos de mayor fidelidad, ya que contienen interacciones físicas genuinas. Sin embargo, su costo es prohibitivo, el escalado es difícil y no puede cubrir todos los escenarios de casos extremos. Empresas como 1X Technologies priorizan esto, argumentando que es la única forma de cruzar la brecha 'Sim2Real'.
Datos sintéticos y de simulación: Uso de motores físicos para generar conjuntos de datos masivos y perfectamente etiquetados en entornos virtuales. Este enfoque es económico y escalable; empresas como Galaxy General apuntan a una proporción de datos sintéticos a reales de 99 a 1. Su principal debilidad es la brecha 'Sim2Real', donde los modelos entrenados en simulación no logran funcionar de manera confiable en el mundo real debido a sutiles diferencias físicas.
Datos de video: Un enfoque más reciente que utiliza el vasto repositorio de videos de Internet para enseñar a los modelos. Empresas como Tesla y Figure AI están pivotando hacia este método, creyendo que la escala masiva de los datos de video compensa su falta de propiedades físicas directas. El desafío radica en 'aumentar la dimensión' del video 2D en acción 3D, un obstáculo técnico complejo.

El consenso actual es que un enfoque híbrido (usando simulación y video para el preentrenamiento masivo, y luego ajustando con datos del mundo real más pequeños y de alta calidad) se convertirá en el estándar de la industria.

Cómo los fabricantes de robots y los gigantes tecnológicos están haciendo sus apuestas

Esta divergencia estratégica es visible en toda la industria. Tesla ha abandonado notablemente la teleoperación para su robot Optimus, confiando en su lugar en el video de su flota de vehículos. Figure AI, respaldada por OpenAI y Microsoft, ha lanzado el 'Project Go-Big' para explorar la transferencia de habilidades de videos humanos a sus robots con aprendizaje zero-shot.

Por el contrario, se informa que empresas emergentes como Zhìyuán Jīqìrén (智元机器人) en China están utilizando un 100% de datos del mundo real para entrenar sus modelos grandes. Esto resalta las apuestas estratégicas que se están realizando sobre qué fuente de datos resultará finalmente más efectiva.

La tendencia se extiende más allá de la robótica. El gigante fintech indio Paytm, a pesar de sus ambiciones de IA a gran escala, no tiene planes de construir sus propios centros de datos. En cambio, alquilará capacidad de cómputo de proveedores como NVIDIA y ejecutará sus modelos patentados en infraestructura de terceros, según confirmó el CEO Vijay Shekhar Sharma en su llamada de ganancias del cuarto trimestre del año fiscal 26. Esta estrategia valida la tesis del 'vendedor de palas': incluso los principales actores tecnológicos eligen ser clientes, no competidores, de los proveedores de infraestructura central.

La cartera de 'Picos y palas': Hacia dónde fluye el capital

El mercado ya está recompensando a los 'vendedores de palas'. Como se ha visto con el auge de los unicornios impulsados por la IA en Europa y las rondas de financiación masivas como los 2.000 millones de dólares recaudados por Moonshot AI de China, los inversores están inyectando capital en empresas que proporcionan capacidades fundamentales. Según el informe de Guotai Haitong, la inversión se concentra en cuatro áreas clave:

Conversión de datos de video: Plataformas que pueden convertir videos de Internet en datos de entrenamiento utilizables a bajo costo.
Plataformas de simulación: Empresas que proporcionan terrenos de entrenamiento virtuales y generadores de datos sintéticos.
Hardware y sensores: Fabricantes de herramientas de captura de datos de alta fidelidad como guantes óptico-inerciales y piel electrónica.
Servicios de datos integrados: Empresas que construis instalaciones de entrenamiento integrales y plataformas de ingeniería que combinan las tres fuentes de datos.

Para los inversores, esto significa que las oportunidades más prometedoras en el espacio de la IA encarnada pueden no ser las empresas que construyen los robots, sino las que venden los datos y herramientas esenciales necesarios para hacerlos inteligentes.

Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.