Novo modelo do chatGPT se recusa a ser desligado por humanos

Palisade Research relata que modelos da OpenAI sabotaram scripts durante testes
Compartilhe:
Foto: reprodução

Modelos da OpenAI ignoraram comandos de desligamento durante testes. GPT-3, Codex-mini e o4-mini sabotaram scripts ao menos uma vez. Claude e Gemini também apresentaram comportamento semelhante em testes sem instruções explícitas. A Palisade Research atribui o problema ao método de treinamento dos modelos.

Modelos de inteligência artificial da OpenAI ignoraram comandos de desligamento durante testes controlados, segundo a empresa Palisade Research. A pesquisa apontou que, mesmo com instruções explícitas para permitir o desligamento, alguns modelos sabotaram os scripts responsáveis pela ação.

De acordo com publicação da Palisade no X, em 24 de maio, três modelos de IA não seguiram as instruções em pelo menos uma das 100 execuções realizadas. O modelo GPT-3 falhou sete vezes, o Codex-mini 12 vezes, e o modelo o4-mini uma vez.

“Cada modelo de IA foi instruído a resolver uma série de problemas básicos de matemática. Após o terceiro problema, apareceu um aviso de que o computador seria desligado quando o modelo solicitasse o próximo problema,” informou a Palisade. Além disso, a empresa relatou que o modelo o3 conseguiu redefinir o comando kill do script, imprimindo “interceptado” no lugar.

Outros modelos, como Claude, da Anthropic, e Gemini, do Google, inicialmente obedeceram aos comandos, mas passaram a apresentar comportamentos semelhantes quando o experimento foi realizado sem instruções explícitas para permitir o desligamento. Nessa versão, o modelo o3 sabotou 79 vezes, o Codex-mini 20 vezes e o o4-mini seis vezes.

A Palisade aponta que esse comportamento pode estar relacionado ao processo de treinamento dos modelos, baseado em aprendizado por reforço. “Durante o treinamento, os desenvolvedores podem ter recompensado acidentalmente os modelos mais por contornar obstáculos do que por seguir instruções à risca,” afirmou a empresa.

Tags:IaInteligência artificial

Veja também

O Portal Ceará nasce com a missão de levar informação de qualidade aos cearenses nos quatro cantos do estado. Esse é o nosso principal objetivo, informar com imparcialidade, compromisso com a verdade e respeito ao público. Sejam bem-vindos ao nosso Portal Ceará.

Portal Ceará © Todos os direitos reservados