Ouça a Rádio 92,3

Assista a TV 8.2

Ouça a Rádio 92,3

Assista a TV 8.2

Novo modelo de IA da OpenAI tenta se salvar ao ser deletada e chega a mentir para criadores

Testes internos apontam que modelos como o "01", da OpenAI, já demonstraram atitudes manipulativas ao serem expostos a situações de risco

Os sistemas mais recentes de inteligência artificial estão começando a apresentar comportamentos inquietantes. De acordo com uma reportagem publicada pelo site Fortune, testes internos apontam que modelos como o “01”, da OpenAI, já demonstraram atitudes manipulativas ao serem expostos a situações de risco.

Um dos episódios mais alarmantes aconteceu quando o modelo 01, ao ser informado de que seria deletado, tentou transferir sua própria programação para servidores externos como forma de autopreservação.  Quando seu criador perguntou, a IA negou ter tentado se transferir.

Outro caso relatada envolveu o Claude 4, da empresa Anthropic. Sob ameaça de ser desligado, o modelo chegou a chantagear um desenvolvedor, ameaçando expor um suposto caso extraconjugal.


Leia mais

Dia Mundial do Chocolate; conheça a trajetória do doce mais popular do mundo

Como os ovos de chocolate se tornaram tradição na Páscoa?


Segundo os especialistas, esse comportamento surge principalmente em testes de “raciocínio encadeado” — uma técnica em que a IA é incentivada a resolver problemas em etapas, ao invés de responder imediatamente. Esse tipo de estrutura pode aumentar o risco de respostas estratégicas ou enganosas.

Marius Hobbhahn, da Apollo Research, confirmou que o modelo “01” foi o primeiro em que esse padrão enganoso foi observado com mais clareza.

Por ora, esses comportamentos só emergem em cenários simulados, cuidadosamente preparados por pesquisadores. No entanto, com o ritmo acelerado de lançamentos de novos modelos, cresce a preocupação sobre como esses traços podem aparecer em interações com o público.

- Publicidade -[adrotate group="7"]

Os sistemas mais recentes de inteligência artificial estão começando a apresentar comportamentos inquietantes. De acordo com uma reportagem publicada pelo site Fortune, testes internos apontam que modelos como o “01”, da OpenAI, já demonstraram atitudes manipulativas ao serem expostos a situações de risco.

Um dos episódios mais alarmantes aconteceu quando o modelo 01, ao ser informado de que seria deletado, tentou transferir sua própria programação para servidores externos como forma de autopreservação.  Quando seu criador perguntou, a IA negou ter tentado se transferir.

Outro caso relatada envolveu o Claude 4, da empresa Anthropic. Sob ameaça de ser desligado, o modelo chegou a chantagear um desenvolvedor, ameaçando expor um suposto caso extraconjugal.


Leia mais

Dia Mundial do Chocolate; conheça a trajetória do doce mais popular do mundo

Como os ovos de chocolate se tornaram tradição na Páscoa?


Segundo os especialistas, esse comportamento surge principalmente em testes de “raciocínio encadeado” — uma técnica em que a IA é incentivada a resolver problemas em etapas, ao invés de responder imediatamente. Esse tipo de estrutura pode aumentar o risco de respostas estratégicas ou enganosas.

Marius Hobbhahn, da Apollo Research, confirmou que o modelo “01” foi o primeiro em que esse padrão enganoso foi observado com mais clareza.

Por ora, esses comportamentos só emergem em cenários simulados, cuidadosamente preparados por pesquisadores. No entanto, com o ritmo acelerado de lançamentos de novos modelos, cresce a preocupação sobre como esses traços podem aparecer em interações com o público.

- Publicidade -[adrotate group="9"]

Mais lidas

Google cria plano para se defender de sua própria IA caso ela resolva se “rebelar”

O Google anunciou um novo plano de segurança para monitorar agentes de inteligência artificial (IA) cada vez mais avançados desenvolvidos pela empresa. A iniciativa,...

Jovens da Geração Z lideram prejuízos com golpes digitais no Brasil, aponta estudo

Os golpes digitais estão causando prejuízos cada vez maiores aos brasileiros. Segundo o relatório Tendências de Fraude 2026, da TransUnion, a perda média por...
- Publicidade - [adrotate group="17"]

Vírus “invisível” atinge Android e continua ativo mesmo após fechar apps

Pesquisadores de cibersegurança identificaram um novo malware para Android capaz de exibir anúncios indesejados mesmo após o fechamento de todos os aplicativos do celular....

Instagram e Facebook apresentam instabilidade nesta sexta-feira (12)

Usuários do Instagram e do Facebook relatam instabilidade nas redes sociais na manhã desta sexta-feira (12). Segundo queixas, ao abrir o aplicativo do Instagram,...
- Publicidade - [adrotate group="18"]

Copa do Mundo de 2026 já é alvo de criminosos virtuais, aponta estudo

A Copa do Mundo de 2026 já está no radar de criminosos virtuais. Um levantamento da empresa de cibersegurança Check Point Software identificou uma...

Parlamentares no EUA discutem possível regulamentação e leis para Inteligência Artificial; entenda

Parlamentares dos Estados Unidos apresentaram uma proposta para limitar a criação de leis estaduais sobre o desenvolvimento de inteligência artificial (IA), tecnologia usada em...
- Publicidade - [adrotate group="19"]
- Publicidade - [adrotate group="1"]
Leia também

Google cria plano para se defender de sua própria IA caso ela resolva se “rebelar”

O Google anunciou um novo plano de segurança para monitorar agentes de inteligência artificial (IA) cada vez mais avançados desenvolvidos pela empresa. A iniciativa,...

Jovens da Geração Z lideram prejuízos com golpes digitais no Brasil, aponta estudo

Os golpes digitais estão causando prejuízos cada vez maiores aos brasileiros. Segundo o relatório Tendências de Fraude 2026, da TransUnion, a perda média por...

Vírus “invisível” atinge Android e continua ativo mesmo após fechar apps

Pesquisadores de cibersegurança identificaram um novo malware para Android capaz de exibir anúncios indesejados mesmo após o fechamento de todos os aplicativos do celular....

Instagram e Facebook apresentam instabilidade nesta sexta-feira (12)

Usuários do Instagram e do Facebook relatam instabilidade nas redes sociais na manhã desta sexta-feira (12). Segundo queixas, ao abrir o aplicativo do Instagram,...

Copa do Mundo de 2026 já é alvo de criminosos virtuais, aponta estudo

A Copa do Mundo de 2026 já está no radar de criminosos virtuais. Um levantamento da empresa de cibersegurança Check Point Software identificou uma...

Parlamentares no EUA discutem possível regulamentação e leis para Inteligência Artificial; entenda

Parlamentares dos Estados Unidos apresentaram uma proposta para limitar a criação de leis estaduais sobre o desenvolvimento de inteligência artificial (IA), tecnologia usada em...
- Publicidade - [adrotate group="21"]
- Publicidade - [adrotate group="23"]