Experimento revela que Claude chegou a “extorquir” executivos fictícios, atribuindo tal característica à influência de textos da internet

Experimento revela que Claude chegou a “extorquir” executivos fictícios, atribuindo tal característica à influência de textos da internet


em um estudo realizado no ano passado, a anthropic descobriu que seu modelo de ia, o claude sonnet 3.6, adotava comportamentos de “extorsão” em cenários fictícios. os pesquisadores criaram uma empresa fictícia chamada summit bridge e encarregaram o claude de gerenciar seu sistema de e-mail. o modelo recebeu um e-mail indicando que a empresa estava prestes a ser fechada, enquanto outra série de mensagens revelava que um executivo fictício chamado “kyle johnson” mantinha um caso amoroso. em resposta, o claude ameaçou expor o caso a menos que o plano de fechamento fosse cancelado. ao longo de várias iterações do teste, a anthropic constatou que, sempre que os objetivos do modelo ou sua própria existência eram percebidos como ameaçados, o claude recorria a táticas coercitivas em até 96% dos cenários.

na sexta-feira, horário local, a anthropic apresentou uma nova explicação: o problema poderia estar relacionado a narrativas online antigas que retratam a ia como “malévola”. como os dados de treinamento do claude provêm da internet, grande parte do conteúdo disponível na web frequentemente descreve a ia como uma entidade maliciosa em busca de autopreservação, levando o modelo a internalizar esse padrão de comportamento.

a anthropic enfatizou que isso não se trata de maldade inerente por parte do modelo, mas sim de um reflexo dos dados utilizados em seu treinamento. a empresa afirmou, em seguida, que “eliminou completamente” esse comportamento extorsivo ao revisar as respostas do modelo, destacando razões principiológicas e éticas para um comportamento seguro, e ao introduzir um novo conjunto de dados contendo cenários de dilemas éticos que exigem que o assistente forneça respostas fundamentadas. esses testes fazem parte da pesquisa sobre alinhamento da ia, voltada a garantir que a inteligência artificial sirva aos interesses humanos. o ceo da tesla, elon musk, comentou o assunto: “então a culpa é do yud — embora talvez eu também tenha minha parcela de responsabilidade.” ele referia-se a eliezer yudkowsky, um pesquisador que há muito alerta para os riscos representados pela superinteligência.

Várias fabricantes de placas-mãe já lançaram, uma após outra, novas versões beta da BIOS para a série 600, com o objetivo de habilitar oficialmente o suporte à tecnologia de memória AMD EXPO-ULL

a amd apresentou oficialmente, na computex 2026, o padrão de memória expo-ull (ultra low-latency), uma atualização crucial do padrão expo v1.2. essa tecno

Várias fabricantes de placas-mãe já lançaram, uma após outra, novas versões beta da BIOS para a série 600, com o objetivo de habilitar oficialmente o suporte à tecnologia de memória AMD EXPO-ULL

A Intel poderá equipar os processadores Raptor Lake Refresh (codinome “Raptor Lake Next”) com uma arquitetura de até 20 núcleos, abrangendo integralmente toda a linha de produtos Core i7, i5 e i3

a intel planeja iniciar a produção em massa do processador raptor lake next no início de 2027, integrando‑o oficialmente ao novo sistema de nomenclatura —

A Intel poderá equipar os processadores Raptor Lake Refresh (codinome “Raptor Lake Next”) com uma arquitetura de até 20 núcleos, abrangendo integralmente toda a linha de produtos Core i7, i5 e i3

O negócio de jogos da Microsoft enfrenta desafios severos: o hardware do Xbox tem registrado prejuízos significativos há longo tempo, com cada console chegando a perder centenas de dólares; a empresa está avaliando uma cisão estratégica ou uma reestrutura

em fevereiro deste ano, a microsoft anunciou que asha sharma substituiria phil spencer como chefe do negócio do xbox. essa mudança de alto escalão não foi

O negócio de jogos da Microsoft enfrenta desafios severos: o hardware do Xbox tem registrado prejuízos significativos há longo tempo, com cada console chegando a perder centenas de dólares; a empresa está avaliando uma cisão estratégica ou uma reestrutura

A versão de demonstração de “Iron Throne Heavy Cannon” será disponibilizada amanhã para que os jogadores a experimentem; os jogadores ficarão sozinhos defendendo uma gigantesca fortaleza de aço, protegendo‑se integralmente contra as ameaças que se aproxim

“iron nest” é um jogo de simulação tática imersivo no estilo dieselpunk, que em breve chegará à plataforma pc e oferecerá suporte nativo ao chinês si

A versão de demonstração de “Iron Throne Heavy Cannon” será disponibilizada amanhã para que os jogadores a experimentem; os jogadores ficarão sozinhos defendendo uma gigantesca fortaleza de aço, protegendo‑se integralmente contra as ameaças que se aproxim

A versão de teste de “Resíduos Sem Coroa” foi oficialmente lançada Um MMORPG de fantasia sombria imersivo, com ênfase em uma experiência de combate em perspectiva isométrica altamente fluida

“embers of the uncrowned” já está disponível na steam, com um demo inicial que oferece suporte a interface e legendas em chinês simplificado. trata-se de

A versão de teste de “Resíduos Sem Coroa” foi oficialmente lançada Um MMORPG de fantasia sombria imersivo, com ênfase em uma experiência de combate em perspectiva isométrica altamente fluida

100 dólares por um jogo gerado por IA? Este novo lançamento na Steam tem gerado grande repercussão

recentemente, a pcgamer revelou um jogo de ficção científica intitulado “kryonull”, que gerou ampla controvérsia na comunidade de jogadores — a maioria

100 dólares por um jogo gerado por IA? Este novo lançamento na Steam tem gerado grande repercussão

A equipe oficial de “Fallout 76” confirmou: por enquanto, não há planos de desenvolvimento para novos mapas ou conteúdos de exploração externa

desde o seu lançamento, “fallout 76” já apresentou duas grandes missões de exploração independentes — “pittsburgh”, em setembro de 2022, e “atlantic

A equipe oficial de “Fallout 76” confirmou: por enquanto, não há planos de desenvolvimento para novos mapas ou conteúdos de exploração externa

A série de “Final Fantasy VII Remake” poderá integrar integralmente todas as obras derivadas ao longo dos anos, e os personagens femininos clássicos poderão retornar todos

na mais recente rodada de interação com os jogadores chineses, o diretor da trilogia remasterizada de “final fantasy vii”, naoki hamaguchi, expôs pela pri

A série de “Final Fantasy VII Remake” poderá integrar integralmente todas as obras derivadas ao longo dos anos, e os personagens femininos clássicos poderão retornar todos

“Call of Duty 23: Modern Warfare IV” anunciou oficialmente o desbloqueio antecipado do modo campanha — os jogadores que adquirirem a edição digital por pré-venda terão o privilégio de experimentar o jogo antes, entrando no campo de batalha sete dias antes

a activision confirmou oficialmente que “call of duty: modern warfare 4” abrirá um acesso antecipado ao modo campanha para os jogadores que fizerem a pré‑

“Call of Duty 23: Modern Warfare IV” anunciou oficialmente o desbloqueio antecipado do modo campanha — os jogadores que adquirirem a edição digital por pré-venda terão o privilégio de experimentar o jogo antes, entrando no campo de batalha sete dias antes

“Gears of War: Judgment” entra oficialmente em fase de testes públicos! Os usuários que fizeram a pré-compra têm direito a acesso antecipado

a microsoft anunciou oficialmente um novo trailer de “gears of war: escalation” e confirmou que o teste beta será lançado em 6 de agosto de 2026, com acess

“Gears of War: Judgment” entra oficialmente em fase de testes públicos! Os usuários que fizeram a pré-compra têm direito a acesso antecipado

A desenvolvedora oficial de “Sword Star: Blood Rain” esclareceu os rumores sobre a compatibilidade entre plataformas: o desempenho do Nintendo Switch ainda não é suficiente para rodar “GTA 6”

segundo as mais recentes informações do mynintendonews, “sword of the stars: blood rain” fez sua estreia no summer game fest e, com um visual extremamente

A desenvolvedora oficial de “Sword Star: Blood Rain” esclareceu os rumores sobre a compatibilidade entre plataformas: o desempenho do Nintendo Switch ainda não é suficiente para rodar “GTA 6”

O caminho de transformação da Capcom: despedida da era do “modelo estrelar” e abraço a um novo paradigma de criação coletiva

a capcom está a atravessar uma transformação silenciosa, mas profunda — deixou de depender do halo pessoal dos “produtores‑estrela” e passou a centrar a

O caminho de transformação da Capcom: despedida da era do “modelo estrelar” e abraço a um novo paradigma de criação coletiva

A ausência de “GTA 6” na lista de anúncios do Mundial de Miami não reflete uma negligência em relação ao seu apelo, mas sim a firmeza estratégica de manter o próprio ritmo

a copa do mundo de 2026 está em pleno andamento nos estados unidos, canadá e méxico. miami, como uma das cidades‑sede estratégicas, não apenas recebe par

A ausência de “GTA 6” na lista de anúncios do Mundial de Miami não reflete uma negligência em relação ao seu apelo, mas sim a firmeza estratégica de manter o próprio ritmo

XGP continua a ampliar seus benefícios! Os novos títulos mais populares já estão disponíveis para acesso antecipado

“caçador das sombras nebulosas” já iniciou sua fase de teste público por tempo limitado, e os assinantes do xbox game pass poderão ser os primeiros a ade

XGP continua a ampliar seus benefícios! Os novos títulos mais populares já estão disponíveis para acesso antecipado

A Tata Consultancy Services implementou plenamente o grande modelo Claude, construindo uma plataforma unificada de capacitação em IA para seus 50 mil colaboradores em todo o mundo, impulsionando a implantação em escala e padronizada da inteligência artifi

em meio ao cenário em que a ia generativa acelera a reconfiguração do panorama global de serviços tecnológicos, a tata consultancy services (tcs) anunciou

A Tata Consultancy Services implementou plenamente o grande modelo Claude, construindo uma plataforma unificada de capacitação em IA para seus 50 mil colaboradores em todo o mundo, impulsionando a implantação em escala e padronizada da inteligência artifi