Pesquisa revela qual a inteligência artificial que mais alucina

0
Votação simbólica de projeto de lei de regulamentação da IA sofreu oposição de senadores bolsonaristas aliados às big techs
(Foto: Reprodução)

Uma pesquisa recente conduzida pela Legal Guardian Digital, empresa de SEO para o setor jurídico, avaliou os chatbots de inteligência artificial mais populares do mercado sob vários critérios. Segundo o estudo, o Google Gemini aparece como a IA com maior taxa de alucinação, entregando informações incorretas em 32% das respostas.

Veja o ranking abaixo:

  1. Google Gemini: 32%
  2. ChatGPT: 30%
  3. Kimi: 27%
  4. Microsoft Copilot: 27%
  5. Meta AI: 25%
  6. Claude: 20%
  7. Grok: 15%
  8. DeepSeek: 14%
  9. Perplexity AI: 13%

A porcentagem é a taxa de alucinação, ou seja, em quantas respostas a IA deu informação errada dentro do teste. No caso do Gemini, a cada 100 respostas analisadas, cerca de 32 continham algum dado factualmente incorreto.

O levantamento explica que as chamadas “alucinações” acontecem porque os Grandes Modelos de Linguagem (LLMs) são treinados para prever a próxima palavra mais provável em uma sequência. Quando o sistema não encontra um padrão confiável para responder, pode acabar gerando uma informação plausível, mas falsa.

O relatório conclui reafirmando a importância do ser humano na verificação das informações: com 25% dos trabalhadores americanos usando IA regularmente, a checagem humana de dados como nomes, datas e valores continua sendo essencial.

A pesquisa também avaliou outros critérios. Em satisfação do cliente, por exemplo, DeepSeek e ChatGPT dividiram a liderança com nota 4,7 de 5, enquanto a Meta AI ficou na última posição, com 3,4.