Las empresas tecnológicas, entre ellas OpenAI, están desarrollando una nueva generación de asistentes de IA que no solamente pueden escribir código, sino también depurarlo, organizarlo y juzgarlo.
por Will Knight
No soy en absoluto un programador experto, pero gracias a un programa gratuito llamado SWE-agent, he podido depurar y solucionar un grave problema relacionado con un archivo mal llamado dentro de diferentes repositorios de código en el sitio de alojamiento de software GitHub.
Dirigí SWE-agent a un problema en GitHub y vi cómo recorría el código y razonaba sobre lo que podía estar mal. Determinó correctamente que la causa del error era una línea que apuntaba a la ubicación incorrecta de un archivo, navegó por el proyecto, localizó el archivo y modificó el código para que todo funcionara correctamente. Es el tipo de cosa que un desarrollador inexperto (como yo) podría pasarse horas intentando depurar.
IA
Muchos programadores ya utilizan la inteligencia artificial para escribir software más rápidamente. GitHub Copilot fue el primer entorno integrado para desarrolladores que aprovechó la IA, pero ahora muchos IDE (Entornos de desarrollo Integrado) completan automáticamente trozos de código cuando un desarrollador empieza a escribir. También puedes hacer preguntas al agente de IA sobre el código, o pedirle que te ofrezca sugerencias sobre cómo mejorar aquello en lo que estás trabajando.
El verano pasado, John Yang y Carlos Jiménez, dos estudiantes de doctorado de Princeton, empezaron a debatir sobre lo que haría falta para que la IA se convirtiera en un ingeniero de software en el mundo real. Esto les llevó, junto con otras personas de Princeton, a idear SWE-bench, un conjunto de puntos de referencia para probar herramientas de IA en una serie de tareas de codificación. Tras publicar la prueba en octubre, el equipo desarrolló su propia herramienta, SWE-agent, para dominar estas tareas.
SWE-agent (“SWE” es la abreviatura de “ingeniería de software“) es uno de los programas de codificación de IA mucho más potentes que van más allá de escribir líneas de código y actúan como agentes de software, aprovechando las herramientas necesarias para gestionar, depurar y organizar el software. En marzo, la startup Devin hizo viral un video de demostración de una de estas herramientas.
Ofir Press, miembro del equipo de Princeton, sostiene que SWE-bench podría ayudar a OpenAI a probar el rendimiento y la fiabilidad de los agentes de software: “Es solo mi opinión, pero creo que lanzarán uno muy pronto”, advierte Press.
“OpenAI definitivamente está trabajando en agentes de codificación”
OpenAI declinó hacer comentarios, pero otra fuente con conocimiento de las actividades de la compañía, que pidió no ser nombrada, dijo a WIRED que “OpenAI definitivamente está trabajando en agentes de codificación.”
Del mismo modo que GitHub Copilot demostró que los grandes modelos de lenguaje pueden escribir código y aumentar la productividad de los programadores, herramientas como SWE-agent pueden demostrar que los agentes de IA pueden funcionar de forma fiable, empezando por la construcción y el mantenimiento de código.
Factory AI
Varias empresas están probando agentes para el desarrollo de software. En lo más alto de la clasificación de SWE-bench, que mide la puntuación de distintos agentes de codificación en diversas tareas, se encuentra uno de Factory AI, una empresa emergente, seguido de AutoCodeRover, una aplicación de código abierto de un equipo de la Universidad Nacional de Singapur.
Varias empresas están probando agentes para el desarrollo de software. En lo más alto de la clasificación de SWE-bench, que mide la puntuación de distintos agentes de codificación en diversas tareas, se encuentra uno de Factory AI, una empresa emergente, seguido de AutoCodeRover, una aplicación de código abierto de un equipo de la Universidad Nacional de Singapur.
Las grandes empresas también están participando. Una herramienta de escritura de software llamada Amazon Q es otra de las mejores del SWE-bench: “El desarrollo de software es mucho más que teclear”, aclara Deepak Singh, vicepresidente de desarrollo de software de Amazon Web Services (AWS).
AWS
Añade que AWS ha utilizado el agente para traducir pilas enteras de software de un lenguaje de programación a otro. “Es como tener a un ingeniero realmente inteligente sentado a tu lado, escribiendo y construyendo una aplicación contigo”, explica Singh. “Creo que eso es bastante transformador”.
Un equipo de OpenAI ayudó recientemente al equipo de Princeton a mejorar un punto de referencia para medir la fiabilidad y eficacia de herramientas como SWE-agent, lo que sugiere que la empresa también podría estar perfeccionando agentes para escribir código o realizar otras tareas en una computadora.
Singh destaca que varios clientes ya están creando aplicaciones backend complejas con Q. Mis propios experimentos con SWE-bench sugieren que cualquiera que codifique pronto querrá utilizar agentes para mejorar su destreza de programación, o se arriesgará a quedarse atrás.
Fuente: https://es.wired.com/articulos/futuro-de-programacion-impulsada-por-ia-esta-cerca