Desde a última vez que escrevemos sobre agentes de engenharia de software , há seis meses, a indústria ainda não chegou a uma definição consensual do termo “agente”. Porém, um avanço significativo surgiu — não em agentes de programação autônomos (que continuam pouco convincentes), mas em agentes de modo supervisionado presentes na IDE. Esses modos permitem que desenvolvedoras conduzam implementações via chat, com ferramentas que não apenas modificam códigos em múltiplas linhas e arquivos, mas também executam comandos, testes e respondem aos feedbacks da IDE, como erros de linting ou de compilação.
Esta abordagem, às vezes chamada de “chat-oriented programming” (CHOP) ou “prompt-to-code”, mantém as desenvolvedoras no controle enquanto transfere mais responsabilidade para a IA do que assistentes de programação tradicionais, como sugestões automáticas. As ferramentas que lideram esse espaço incluem Cursor, Cline e Windsurf, com GitHub Copilot levemente atrasado, porém conquistando espaço rapidamente. A utilidade desses agentes dependem tanto do modelo usado (com a série Sonnet do Claude sendo o estado da arte atual) quanto a da qualidade de integração com a IDE para proporcionar uma boa experiência à desenvolvedora.
Nós achamos esses fluxos de trabalho interessantes e promissores, pois trazem um aumento notável na velocidade de codificação. Porém, manter um escopo pequeno de problemas ajuda as desenvolvedoras a revisarem melhor as mudanças feitas por IA. Esses fluxos funcionam melhor com prompts de baixa abstração e bases de códigos compatíveis com IA que sejam bem estruturadas e devidamente testadas. À medida em que esses métodos melhoram, também aumenta o risco de complacência com códigos gerados por IA. Para mitigar esse problema, aplique programação em par (pair programming) e outras práticas efetivas de revisão, especialmente para códigos em produção.
Um dos tópicos mais comentados, atualmente, no espaço de IA generativa, é o conceito de agentes de engenharia de software. Essas ferramentas de assistência de codificação fazem mais do que apenas ajudar a pessoa engenheira com trechos de código aqui e ali; elas ampliam o tamanho do problema que podem resolver, idealmente de forma autônoma e com o mínimo de interferência de uma pessoa. A ideia é que essas ferramentas possam pegar um problema do GitHub ou um tíquete do Jira e propor um plano e alterações de código para implementá-lo, ou até mesmo criar uma pull request para uma pessoa revisar. Embora este seja o próximo passo lógico para aumentar o impacto da assistência de codificação com IA, a meta frequentemente anunciada de agentes genéricos que podem cobrir uma ampla gama de tarefas de codificação é muito ambiciosa, e o estado atual das ferramentas ainda não está mostrando isso de forma convincente. No entanto, podemos acompanhar isso funcionando mais cedo ou mais tarde para um escopo mais limitado de tarefas diretas, liberando tempo da pessoa desenvolvedora para trabalhar em problemas mais complexos. As ferramentas que estão lançando e comercializando versões beta de agentes incluem GitHub Copilot Workspace, qodo flow, Tabnine's agents for JIRA e Amazon Q Developer. O comparador SWE Bench lista ferramentas neste contexto, mas alertamos para levar as comparações no campo da IA com cautela.
