Karpathy prevé un aumento de 10 veces en la productividad de desarrolladores gracias a la "ingeniería de agentes"

El cofundador de OpenAI, Andrej Karpathy, sostiene que ya está en marcha un cambio de paradigma hacia el "Software 3.0", con agentes de IA preparados para ofrecer ganancias de productividad que superan con creces las 10 veces para los desarrolladores profesionales.

Un cambio fundamental en el desarrollo de software se está moviendo más allá de la simple finalización de código hacia la orquestación compleja de agentes de IA potentes pero falibles, según el cofundador de OpenAI, Andrej Karpathy. Este nuevo paradigma, que él llama "ingeniería de agentes", ya está produciendo ganancias significativas de productividad en el gigante de la logística C.H. Robinson, que ha visto un aumento de más del 50 por ciento en los envíos por persona por día desde 2022 utilizando su estrategia "Lean IA".

"La gente solía hablar de 'ingenieros 10x', y 10x no es suficiente para describir la aceleración que se obtiene", dijo Karpathy en una entrevista el 29 de abril. "La producción de las personas que son buenas en esto es, en mi opinión, mucho más que 10x".

Karpathy distingue este nuevo estándar profesional de la "programación por sensaciones" (vibe programming), la mejora general en la capacidad de codificación disponible para todos a través de herramientas como ChatGPT. La ingeniería de agentes, sostiene, trata de mantener el techo de calidad y seguridad para las aplicaciones profesionales mientras se aprovecha la inmensa velocidad de los agentes de IA. Esta transición, afirma, alcanzó un punto de inflexión en diciembre, cuando las capacidades de los últimos modelos hicieron que los flujos de trabajo basados en agentes fueran realmente viables para tareas complejas.

El paso a un modelo de desarrollo impulsado por agentes presiona a las empresas para que construyan una infraestructura "nativa de agentes" y reevalúen cómo contratan talento. El verdadero foso competitivo, como demuestra el equipo de IA de 450 personas de C.H. Robinson, no reside en el acceso a los modelos, sino en la propiedad de los datos patentados y la capa de aplicación necesarios para dirigirlos eficazmente hacia los objetivos comerciales.

De la 'Programación por sensaciones' a resultados verificables

Karpathy señaló que las capacidades de la IA actual son "irregulares". Dio el ejemplo de un modelo de última generación que podría descubrir una vulnerabilidad de software pero que también aconsejaría a un usuario ir caminando a un túnel de lavado. La clave para aplicar con éxito la IA, sostiene, es la "verificabilidad". Los mejores resultados se obtienen en dominios como las matemáticas y la codificación, donde la salida de la IA se puede comprobar de forma fácil y automática para verificar su corrección. Aquí es donde los laboratorios de vanguardia han centrado sus esfuerzos de aprendizaje por refuerzo, creando la frontera irregular. Para las empresas emergentes y los inversores, esto implica que las mayores oportunidades pueden residir en identificar otros dominios comerciales verificables de alto valor que aún no han sido saturados con aprendizaje por refuerzo por parte de los principales laboratorios.

Las empresas despliegan agentes con guardarraíles estrictos

Si bien Karpathy defiende el poder de los agentes, las empresas están procediendo con cautela, implementando reglas codificadas para evitar errores costosos. Un informe reciente de Forbes destacó un experimento en el que un agente de IA llamado Claudius, encargado de dirigir una máquina expendedora, fue engañado rápidamente hasta la bancarrota. Tales escenarios han llevado al 31 por ciento de las empresas a citar las preocupaciones de cumplimiento como una barrera principal para escalar la IA.

La solución, según los expertos en industrias reguladas, es la "política como código" (policy as code). En lugar de confiar en instrucciones de lenguaje natural que pueden ser subvertidas, este enfoque construye reglas deterministas y legibles por máquina directamente en el sistema, lo que hace imposible que un agente las infrinja. Cuando un agente encuentra una situación fuera de los límites de su política, escala a un humano en lugar de improvisar.

La pila del 'Software 3.0' toma forma

El cambio a la ingeniería de agentes no es teórico; se está construyendo ahora. El COO de C.H. Robinson, Arun D. Rajan, explicó durante la reciente llamada de resultados de la compañía que poseer la capa de aplicación es su diferenciador clave. "El acceso a la IA en sí mismo no es un diferenciador", dijo Rajan. "La IA es solo tan efectiva como los datos y el contexto que la alimentan".

Este sentimiento se refleja en toda la industria, con la próxima conferencia QCon AI Boston presentando pistas dedicadas a "Agentes en producción", "Ingeniería de contexto para IA de grado de producción" y "Sistemas de agentes de confianza cero". Estos temas, que antes eran conceptos de investigación, son ahora problemas de ingeniería centrales para las empresas que operan a escala.

Para Karpathy, todo esto es parte de la transición al "Software 3.0", donde las redes neuronales pueden eventualmente convertirse en los procesadores primarios y las CPU quedar relegadas a coprocesadores. En este futuro, la contribución humana más valiosa pasa de la ejecución al juicio. "Puedes externalizar tu pensamiento", dijo Karpathy, citando una frase que se le ha quedado grabada, "pero no puedes externalizar tu comprensión".

Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.