Desde que escribimos sobre agentes de ingeniería de software hace seis meses, la industria aún carece de una definición compartida del términoagente. Sin embargo, ha surgido un desarrollo importante, no en agentes de codificación completamente autónomos (que siguen sin ser convincentes), sino en modos de agentes supervisados dentro del IDE. Estos modos permiten a los desarrolladores dirigir la implementación a través de chat, con herramientas que no solo modifican el código en múltiples archivos, sino que también ejecutan comandos, realizan pruebas y responden a la retroalimentación del IDE, como errores de estilo o compilación.
Este enfoque, a veces llamadoprogramación orientada por chat (CHOP por sus siglas en inglés) oprompt-to-code (indicación a código), mantiene el control en los desarrolladores mientras se transfiere más responsabilidad a la IA que los asistentes de codificación tradicionales, como las sugerencias automáticas. Las herramientas líderes en este espacio incluyen Cursor, Cline y Windsurf, con GitHub Copilot ligeramente rezagado pero alcanzando a los otros rápidamente. La utilidad de estos modos de agentes depende tanto del modelo utilizado (con Claude's Sonnet series siendo actualmente la referencia) como qué tan bien se integra con el IDE para proporcionar una buena experiencia de desarrollo.
Hemos encontrado estos flujos de trabajo interesantes y prometedores, con un notable aumento en la velocidad de codificación. Sin embargo, mantener pequeños los alcances de los problemas ayuda a los desarrolladores a revisar mejor los cambios generados por la IA. Esto funciona mejor con indicaciones de baja abstracción y bases de código amigables con la IA que estén bien estructuradas y debidamente probadas. A medida que estos modos mejoren, también aumentarán el riesgo de complacencia con el código generado por la IA. Para mitigar esto, recomendamos la programación en pareja y otras prácticas de revisión disciplinadas, especialmente para el código de producción.
Uno de los temas más interesantes en este momento en el espacio GenAI es el concepto de Asistente de Ingeniería de Software. Estas herramientas de asistencia al código hacen más que simplemente ayudar a los ingenieros con fragmentos de código aquí y allá; amplifica el tamaño del problema que pueden resolver, idealmente de forma autónoma y con mínima intervención humana. La idea es que estas herramientas puedan tomar una incidencia de GitHub o un ticket de Jira y proponer un plan y cambios en el código para implementarlo, o incluso crear una revisión de código para que una persona lo revise. Si bien éste es el siguiente paso lógico para aumentar el impacto de la asistencia al código con IA, el publicitado objetivo de asistentes genéricos que puedan cubrir una amplia gama de tareas de programación es muy ambicioso, y el estado actual de las herramientas aún no lo demuestra de manera convincente. Sin embargo, podemos ver que esto funcionará más pronto que tarde para un alcance más limitado de tareas sencillas, lo que liberará tiempo de los desarrolladores para trabajar en problemas más complejos. Las herramientas que están lanzando y comercializando versiones beta de agentes incluyen GitHub Copilot Workspace, qodo flow, Agentes para jira JIRA de Tabnine o Amazon Q Developer. La referente SWE Bench enumera más herramientas en ese espacio, pero recomendamos tomar los benchmark en el espacio de la IA con cautela.
