
Uma pesquisa recente conduzida pela Legal Guardian Digital, empresa de SEO para o setor jurídico, avaliou os chatbots de inteligência artificial mais populares do mercado sob vários critérios. Segundo o estudo, o Google Gemini aparece como a IA com maior taxa de alucinação, entregando informações incorretas em 32% das respostas.
Veja o ranking abaixo:
- Google Gemini: 32%
- ChatGPT: 30%
- Kimi: 27%
- Microsoft Copilot: 27%
- Meta AI: 25%
- Claude: 20%
- Grok: 15%
- DeepSeek: 14%
- Perplexity AI: 13%
A porcentagem é a taxa de alucinação, ou seja, em quantas respostas a IA deu informação errada dentro do teste. No caso do Gemini, a cada 100 respostas analisadas, cerca de 32 continham algum dado factualmente incorreto.
O levantamento explica que as chamadas “alucinações” acontecem porque os Grandes Modelos de Linguagem (LLMs) são treinados para prever a próxima palavra mais provável em uma sequência. Quando o sistema não encontra um padrão confiável para responder, pode acabar gerando uma informação plausível, mas falsa.
O relatório conclui reafirmando a importância do ser humano na verificação das informações: com 25% dos trabalhadores americanos usando IA regularmente, a checagem humana de dados como nomes, datas e valores continua sendo essencial.
A pesquisa também avaliou outros critérios. Em satisfação do cliente, por exemplo, DeepSeek e ChatGPT dividiram a liderança com nota 4,7 de 5, enquanto a Meta AI ficou na última posição, com 3,4.