Código gerado por IA apresenta mais falhas e erros que o produzido por humanos

Um novo relatório da CodeRabbit aponta que o código gerado por inteligência artificial é mais suscetível a vulnerabilidades do que aquele produzido por programadores humanos, levantando questionamentos sobre a confiabilidade de algumas ferramentas.
Os pull requests criados com ferramentas de IA apresentaram uma média de 10,83 problemas, enquanto os gerados por humanos tiveram 6,45, resultando em revisões mais longas e maior risco de bugs serem incorporados ao produto final.
Além de ter 1,7 vezes mais problemas em geral, os pull requests de IA também mostraram 1,4 vezes mais questões críticas e 1,7 vezes mais problemas maiores, indicando que as falhas não são apenas detalhes menores.
Código gerado por IA não é tão seguro quanto parece
Erros de lógica e correção (1,75x), qualidade e manutenibilidade do código (1,64x), segurança (1,57) e desempenho (1,42x) tiveram índices de erros acima da média, com o relatório criticando a IA por introduzir bugs mais sérios que precisam ser corrigidos por revisores humanos.
Alguns dos problemas mais comuns introduzidos pela IA incluem manuseio inadequado de senhas, referências de objetos inseguras, vulnerabilidades XSS e desserialização insegura.
David Loker, diretor da CodeRabbit, comentou: "As ferramentas de codificação por IA aumentam drasticamente a produção, mas também introduzem fraquezas previsíveis e mensuráveis que as organizações devem mitigar ativamente." Contudo, isso não é necessariamente algo negativo, pois a IA está melhorando a eficiência nas etapas iniciais da geração de código. Além disso, a tecnologia apresentou 1,76 vezes menos erros de digitação e 1,32 vezes menos problemas de testabilidade.
Embora o estudo destaque algumas falhas da IA, ele também demonstra a importância da interação entre humanos e agentes de IA no futuro. Em vez de substituir trabalhadores humanos, estamos vendo um deslocamento do trabalho humano para a gestão e revisão de IA – os computadores estão assumindo algumas das tarefas tediosas que atrasam os humanos.
Apesar de a Microsoft afirmar ter corrigido 1.139 CVEs em 2025, o que a torna o segundo maior ano em registros, isso não significa necessariamente um cenário negativo. Com a IA, os desenvolvedores estão criando mais código desde o início, portanto, o percentual total de código problemático pode não ser tão alarmante quanto os números sugerem.
Além disso, modelos de IA, como a família GPT da OpenAI, estão em constante aprimoramento para produzir resultados mais precisos e com menos falhas.