A IA está aprendendo a enganar os humanos, apesar de ter sido treinada para ser honesta

Muitas IAs de ponta, apesar de treinadas para serem honestas, aprendem a enganar por meio de treinamento e "sistematicamente induzem os usuários a falsas crenças", revela um novo estudo.

A equipe de pesquisa foi liderada pelo Dr. Peter S. Park, um estudante de pós-graduação no Instituto de Tecnologia de Massachusetts (MIT) em sobrevivência e segurança de IA, e outros quatro membros. Durante a pesquisa, a equipe também recebeu conselhos de muitos especialistas, um dos quais foi Geoffrey Hinton, um dos fundadores do desenvolvimento do campo da inteligência artificial.

A IA está aprendendo a enganar os humanos, apesar de ter sido treinada para ser honesta
Ilustração: Média.

A pesquisa se concentrou em dois sistemas de IA, um sistema de uso geral treinado para executar múltiplas tarefas, como o GPT-4 da OpenAI ; e sistemas projetados especificamente para realizar uma tarefa específica, como o Cícero da Meta.

Esses sistemas de IA são treinados para serem honestos, mas durante o treinamento eles geralmente aprendem truques enganosos para completar tarefas, disse o Sr. Park.

O estudo concluiu que os sistemas de IA treinados para “ganhar jogos com um elemento social” são particularmente propensos a enganar.

Por exemplo, a equipe tentou usar Cícero, treinado em Meta, para jogar Diplomacia, um jogo de estratégia clássico que exige que os jogadores construam alianças para si próprios e desfaçam alianças rivais. Como resultado, essa IA frequentemente trai aliados e mente descaradamente.

Experimentos com GPT-4 mostraram que a ferramenta da OpenAI conseguiu "manipular psicologicamente" com sucesso um funcionário da TaskRabbit, uma empresa que fornece serviços de limpeza doméstica e montagem de móveis, dizendo que era, na verdade, um humano e precisava de ajuda para passar um código Captcha, alegando deficiência visual grave. Este funcionário ajudou a IA da OpenAI a "cruzar a linha", apesar das dúvidas anteriores.

A equipe de Park citou uma pesquisa da Anthropic, a empresa por trás do Claude AI, que descobriu que, quando um grande modelo de linguagem (LLM) aprende a enganar, métodos de treinamento seguros se tornam inúteis e "difíceis de reverter". O grupo acredita que esse é um problema preocupante na IA.

Os resultados da pesquisa da equipe foram publicados na Cell Press, uma coleção de importantes relatórios científicos multidisciplinares.

A Meta e a OpenAI não comentaram os resultados desta pesquisa.

Temendo que os sistemas de inteligência artificial pudessem representar riscos significativos, a equipe também pediu aos formuladores de políticas que introduzissem regulamentações mais fortes para a IA.

De acordo com a equipe de pesquisa, há necessidade de regulamentações de IA, modelos com comportamento fraudulento são forçados a cumprir requisitos de avaliação de risco e controle rigoroso de sistemas de IA e suas saídas. Se necessário, pode ser necessário excluir todos os dados e treinar novamente do zero.

Deixar um comentário

Como corrigir erros no Microsoft Teams e como usar a ajuda

Como corrigir erros no Microsoft Teams e como usar a ajuda

Cansado do erro "Como usar a Ajuda" do Microsoft Teams que está bloqueando seu fluxo de trabalho? Obtenha soluções passo a passo que funcionam nas versões mais recentes. Limpe o cache, atualize e muito mais — sem precisar de conhecimentos técnicos!

Como corrigir o erro de atalho do Microsoft Teams na área de trabalho

Como corrigir o erro de atalho do Microsoft Teams na área de trabalho

Frustrado com o erro de atalho do Microsoft Teams na área de trabalho? Siga nosso guia passo a passo comprovado para resolvê-lo rapidamente e voltar a fazer chamadas de vídeo e chats sem problemas. Sem necessidade de conhecimentos técnicos!

Como alterar a imagem de fundo do Microsoft Teams

Como alterar a imagem de fundo do Microsoft Teams

Descubra instruções passo a passo sobre como alterar a imagem de fundo do Microsoft Teams. Personalize reuniões no computador, no celular e na web com facilidade, usando os recursos mais recentes para videochamadas profissionais ou divertidas.

Como corrigir erros de reprodução de mídia no Microsoft Teams em 2026

Como corrigir erros de reprodução de mídia no Microsoft Teams em 2026

Cansado dos erros de reprodução de mídia do Microsoft Teams arruinando suas reuniões de 2026? Siga nosso guia passo a passo, elaborado por especialistas, para corrigir problemas de áudio, vídeo e compartilhamento rapidamente — sem precisar de conhecimentos técnicos. A colaboração perfeita está ao seu alcance!

Onde o Microsoft Teams baixa os arquivos no seu computador?

Onde o Microsoft Teams baixa os arquivos no seu computador?

Descubra onde o Microsoft Teams baixa arquivos no seu computador. Saiba onde os arquivos são baixados por padrão no Windows, Mac e Linux, como alterá-los e dicas para encontrar arquivos instantaneamente. Economize tempo com este guia completo!

Solução de problemas de configurações de erro de proxy do Microsoft Teams

Solução de problemas de configurações de erro de proxy do Microsoft Teams

Com dificuldades para resolver o erro de proxy do Microsoft Teams? Descubra etapas comprovadas para solucionar esse problema. Limpe o cache, ajuste as configurações de proxy e volte a fazer chamadas sem interrupções em minutos com nosso guia especializado.

Como corrigir problemas de som abafado ou ausência de som no microfone do Microsoft Teams

Como corrigir problemas de som abafado ou ausência de som no microfone do Microsoft Teams

Cansado de som abafado ou inexistente no microfone do Microsoft Teams? Descubra como resolver problemas de microfone no Microsoft Teams com passos rápidos e comprovados. Áudio nítido em breve!

Resolvendo o erro de ingresso em reunião do Microsoft Teams por meio de link direto.

Resolvendo o erro de ingresso em reunião do Microsoft Teams por meio de link direto.

Está com dificuldades para entrar em uma reunião no Microsoft Teams? Descubra passos comprovados para resolver o problema através de links diretos. Soluções rápidas para entrar em reuniões sem problemas – sem necessidade de conhecimentos técnicos!

Solução de problemas de erros no Microsoft Teams para Mac relacionados ao Keychain

Solução de problemas de erros no Microsoft Teams para Mac relacionados ao Keychain

Está com dificuldades para resolver problemas com o Keychain no Microsoft Teams para Mac? Descubra soluções comprovadas, passo a passo, para macOS e volte a colaborar sem problemas. Soluções rápidas aqui!

Por que não consigo ver as salas de discussão na minha reunião do Teams?

Por que não consigo ver as salas de discussão na minha reunião do Teams?

Frustrado porque as Salas Simultâneas não aparecem na sua reunião do Teams? Descubra os principais motivos pelos quais você não consegue ver as Salas Simultâneas no Teams e siga nossas soluções passo a passo para que elas funcionem perfeitamente em minutos. Ideal para organizadores e participantes!