La startup de robótica Physical Intelligence está en negociaciones para una nueva ronda de financiación que valoraría a la empresa en casi 11.000 millones de dólares, casi el doble de su valoración anterior, tras un avance en la investigación en el que su nuevo modelo de IA dirigió a un robot para realizar tareas para las que nunca fue entrenado. El nuevo modelo de la empresa de dos años, π0.7, demuestra lo que denomina "generalización compositiva", una capacidad largamente buscada que permite a un robot combinar habilidades aprendidas en diferentes contextos para resolver problemas novedosos, un paso significativo hacia un cerebro robótico de propósito general.
"Una vez que se cruza ese umbral en el que pasa de hacer solo exactamente lo que se recopiló en los datos a remezclar realmente las cosas de nuevas maneras, las capacidades aumentan de forma más que lineal con la cantidad de datos", dijo Sergey Levine, cofundador de Physical Intelligence y profesor de la UC Berkeley. Señaló que esta propiedad de escalado se ha visto en otros dominios de la IA como el lenguaje y la visión, lo que sugiere que el campo de la robótica podría estar en un punto de inflexión similar.
La afirmación central se centra en la capacidad del modelo para sintetizar información fragmentada. En una demostración clave, π0.7 permitió a un robot utilizar una freidora de aire para cocinar un boniato, a pesar de que los datos de entrenamiento contenían solo dos episodios breves y no relacionados con el aparato. El modelo igualó el rendimiento de modelos especializados de una sola tarea en tareas complejas como preparar café y doblar la ropa. Physical Intelligence ha recaudado más de 1.000 millones de dólares hasta la fecha y su última valoración fue de 5.600 millones de dólares.
Este avance tecnológico podría acelerar la comercialización de robots de propósito general, transformando potencialmente industrias desde la fabricación hasta la logística. Para los inversores, indica un desarrollo importante en el sector de la IA y la robótica que podría impulsar más inversiones y actividad de fusiones y adquisiciones. Sin embargo, la empresa se ha negado rotundamente a ofrecer un cronograma de comercialización, una postura que no ha disuadido a los inversores, en parte debido al pedigrí del cofundador Lachy Groom, un ángel inversor de gran prestigio que respaldó empresas como Figma y Notion.
De la memorización rutinaria a los "unicornios en Perú"
El avance con π0.7 marca un alejamiento del paradigma estándar de entrenamiento robótico, que se basa en la recopilación de conjuntos de datos masivos para cada tarea específica, una forma de memorización rutinaria. Al lograr la generalización compositiva, el modelo puede inferir cómo realizar una nueva tarea combinando conocimientos previos, aparentemente no relacionados. Levine comparó los sorprendentes resultados con el momento en que los investigadores vieron por primera vez el modelo de lenguaje GPT-2 generar una historia sobre unicornios en los Andes, una combinación extraña que nunca se le enseñó explícitamente.
"Mi experiencia siempre ha sido que cuando conozco profundamente lo que hay en los datos, puedo adivinar lo que el modelo será capaz de hacer", dijo Ashwin Balakrishna, científico investigador de Physical Intelligence. "Raramente me sorprendo. Pero los últimos meses han sido la primera vez que me he sentido genuinamente sorprendido".
El equipo de investigación sigue siendo franco sobre las limitaciones actuales del modelo. Todavía no puede ejecutar tareas complejas de varios pasos a partir de un único comando de alto nivel como "hazme una tostada". Sin embargo, destaca cuando se le entrena con instrucciones verbales paso a paso, lo que sugiere que los robots podrían desplegarse en nuevos entornos y ser enseñados in situ por trabajadores humanos sin necesidad de ser reentrenados. En un experimento, la tasa de éxito para la tarea de la freidora de aire saltó del 5% al 95% después de que los investigadores dedicaran 30 minutos a refinar las instrucciones.
La pregunta de los 11.000 millones de dólares
Aunque la investigación se presenta con cautela, describiendo "primeros signos" de generalización, las implicaciones financieras son más inmediatas. Las conversaciones reportadas para una nueva ronda que valora a Physical Intelligence cerca de los 11.000 millones de dólares subrayan el intenso apetito de los inversores por empresas que muestran avances fundamentales en IA. Esta valoración es particularmente notable para una empresa que no se ha comprometido con un programa de despliegue de productos.
Levine rechazó las posibles críticas de que las tareas demostradas son "aburridas" en comparación con los vídeos virales de robots haciendo saltos mortales. Argumentó que la generalización siempre parecerá menos dramática que una acrobacia cuidadosamente coreografiada, pero es considerablemente más útil y representa la verdadera frontera. La capacidad de la empresa para atraer capital institucional de primer nivel sin una vía clara de ingresos se basa en la creencia de que resolver la generalización robótica es un premio donde el ganador se lo lleva todo.
Cuando se le preguntó sobre un cronograma para el despliegue en el mundo real, Levine declinó especular, pero dijo que el progreso es "más rápido de lo que esperaba hace un par de años". Para los inversores, la apuesta no es por un producto específico, sino por la idea de que Physical Intelligence está construyendo el "cerebro" fundamental que algún día podría alimentar una vasta gama de sistemas robóticos en toda la economía.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.