Engenharia de prompt se refere ao processo de projetar e refinar prompts de modelos de IA generativa para produzir respostas de alta qualidade e contextualizadas. Isso envolve a elaboração de prompts claros, específicos e relevantes para tarefas sob medida ou aplicações, para otimizar a saída do modelo. À medida que as capacidades dos modelos de linguagem de grande porte (LLMs) evoluem, particularmente com o surgimento dos modelos de raciocínio, as práticas da engenharia de prompt devem também se adaptar. Baseado em nossa experiência em geração de código com IA, nós observamos que o few-shot prompting pode ter uma performance inferior ao zero-shot prompting quando trabalhado com modelos de raciocínio. Adicionalmente, o amplamente utilizado chain-of-thought (CoT) pode degradar a performance de modelos de raciocínio — provavelmente porque a aprendizagem por reforço já tem ajuste fino embutido no macanismo CoT.
Nossa experiência prática está alinhada com as pesquisas acadêmicas, que sugerem que “modelos avançados podem eliminar a necessidade de engenharia de prompt na engenharia de software.” No entanto, técnicas de engenharia de prompt tradicionais ainda desempenham um papel crucial na redução de alucinações e na melhoria da qualidade das respostas, especialmente considerando as diferenças em tempo de resposta e custos de token entre modelos de raciocínio e LLMs genéricos. Ao construir aplicações de agente, nós recomendamos a escolha estratégica dos modelos com base nas suas necessidades, enquanto continua a refinar seus modelos de prompt e técnicas correspondentes. Encontrar o equilíbrio certo entre desempenho, tempo de resposta e custo de token continua sendo essencial para maximizar a eficácia dos LLMs.
Engenharia de prompt se refere ao processo de projetar e refinar prompts para modelos de IA generativos, visando obter respostas de alta qualidade. Isso envolve a construção cuidadosa de prompts que sejam específicos, nítidos e relevantes para a aplicação ou tarefa desejadas, de forma a induzir respostas úteis do modelo. A "engenharia de prompt" tem por objetivo melhorar a capacidade dos grandes modelos de linguagens (LLMs) em tarefas como responder a perguntas, raciocínio aritmético ou em contexto específicos de um domínio. Para o desenvolvimento de software, a engenharia de prompt poderia ser usada para fazer um LLM escrever uma história, uma API ou um banco de testes baseado em uma conversa curta com uma das partes interessadas ou em algumas anotações. Desenvolver técnicas eficazes de estímulo está se tornando uma habilidade valiosa para trabalhar com sistemas de IA. Há debates se a engenharia de prompt é uma ciência ou uma arte, e potenciais riscos de segurança, tais como "ataques de injeção de prompts", também devem ser considerados .
