Tag: segurança

  • Nous Research Lança Modo Blank Slate no Hermes Agent: Agente Mínimo com Controle Total

    Nous Research Lança Modo Blank Slate no Hermes Agent: Agente Mínimo com Controle Total

    A Nous Research acaba de lançar um novo modo de configuração para o Hermes Agent, seu framework open-source de agentes de IA auto-melhoráveis. Chamado de Blank Slate (“tela em branco”), o modo inverte a lógica tradicional de onboarding: em vez de um agente completamente carregado com todas as funcionalidades ativas, você começa com quase nada — e habilita apenas o que realmente precisa.

    O que é o Blank Slate

    Em uma instalação limpa, o comando hermes setup agora oferece três modos de configuração:

    • Quick Setup: usa o portal da Nous com login OAuth gratuito, sem necessidade de chaves API. É o caminho mais rápido e recomendado para iniciantes.
    • Full Setup: você percorre cada provedor, ferramenta e opção manualmente, fornecendo suas próprias chaves. Controle total.
    • Blank Slate (novo): o caminho mínimo. Apenas três componentes vêm ativados por padrão: provedor e modelo, File Operations (operações de arquivo) e Terminal. Todo o resto fica desabilitado.

    Tudo que começa desligado no Blank Slate: web, navegador, execução de código, visão computacional, memória, delegação, cron jobs, skills, plugins e servidores MCP. Compressão, checkpoints, roteamento inteligente e captura de memória também ficam fora.

    Por que o formato de configuração importa

    O Blank Slate não apenas alterna funcionalidades em tempo de execução — ele grava a decisão em disco. O modo escreve uma lista explícita em platform_toolsets.cli e outra em agent.disabled_toolsets. Juntas, essas duas chaves fixam a superfície do agente de forma permanente.

    O efeito é durável: nada que você deixou de fora será carregado depois, nem mesmo após um hermes update. Uma atualização não pode reativar silenciosamente um toolset que você desligou.

    A separação de responsabilidades também é clara: tokens e segredos ficam em ~/.hermes/.env, enquanto configurações não sensíveis vão para ~/.hermes/config.yaml. O CLI roteia cada valor para o arquivo correto.

    Casos de uso ideais

    Três cenários se beneficiam do Blank Slate:

    1. Ambientes de segurança restrita: quando você quer um agente sem acesso à web e sem navegador. O Blank Slate entrega apenas arquivos e terminal. Nada alcança a rede a menos que você adicione explicitamente.

    2. Times com configuração reprodutível: você fixa um toolset conhecido em todas as máquinas da equipe. Atualizações não introduzem surpresas — a superfície é idêntica em qualquer lugar.

    3. Desenvolvedores que constroem do zero: se você quer entender exatamente o que cada componente faz antes de ativá-lo, o Blank Slate é o ponto de partida ideal. Habilite skills, plugins e MCP à medida que cada necessidade surgir.

    Comparação entre os modos

    Modo Padrão ativo Autenticação Ideal para
    Quick Setup (Portal Nous) Modelo + Tool Gateway OAuth gratuito, sem API keys Primeira execução mais rápida
    Full Setup Todas as ferramentas (escolha manual) Suas próprias chaves Controle total e personalizado
    Blank Slate Provider, File Ops, Terminal Apenas auth do provider Segurança, minimalismo, reprodutibilidade

    Disponibilidade

    O Blank Slate está disponível agora no Hermes Agent. Para usar, execute hermes setup em uma instalação limpa e selecione a terceira opção. Se você já tem um agente rodando com Quick ou Full Setup, pode reconfigurar com hermes setup agent para ajustar toolkits individuais.

    A Nous Research continua expandindo o Hermes Agent como uma alternativa open-source robusta no ecossistema de agentes de IA — agora com ainda mais controle nas mãos do desenvolvedor.

  • Controles de Exportação de IA: A História Mostra Por Que Restringir o Mythos Não Vai Funcionar

    Controles de Exportação de IA: A História Mostra Por Que Restringir o Mythos Não Vai Funcionar

    Capa: Controles de exportação de IA

    Na semana passada, citando preocupações não especificadas de segurança nacional, a Casa Branca ordenou que a Anthropic restringisse a exportação de seus poderosos modelos de IA — Fable e Mythos — para qualquer pessoa fora dos Estados Unidos, incluindo estrangeiros dentro do país. Pouco depois, a gigante de IA desligou abruptamente ambos os modelos, que estão indisponíveis para qualquer pessoa há uma semana.

    Este episódio é o primeiro teste real sobre se o governo dos EUA pode usar controles de exportação para conter a IA de fronteira da mesma forma que tentou — com resultados muito irregulares — conter a criptografia e o spyware antes dela. E, por mais dramático que pareça, o desfecho desse impasse pode moldar não apenas o acesso da Anthropic a mercados estrangeiros, mas também o manual que outros laboratórios de IA terão que seguir.

    O que desencadeou a proibição?

    Desde que a Anthropic lançou o Mythos em abril, a empresa o comercializou como uma espécie de “máquina cibernética do apocalipse” que poderia causar estragos na internet se liberada amplamente. Por isso, antes da proibição, apenas cerca de 150 empresas e organizações governamentais tinham acesso ao modelo. O objetivo era ajudar defensores a proteger seus sistemas antes que agentes mal-intencionados alcançassem capacidades similares.

    Dois eventos subsequentes teriam desencadeado a proibição:

    1. A Anthropic deu a uma operadora de telecom sul-coreana acesso ao Mythos através de seu programa limitado de parceiros, e autoridades americanas se alarmaram ao identificar a empresa como suspeita de ter laços com a China. (A empresa, amplamente reportada como SK Telecom, negou qualquer conexão com a China.)

    2. O CEO da Amazon, Andy Jassy, também teria alertado o governo após pesquisadores da Amazon encontrarem uma forma de contornar as salvaguardas do Fable 5. A Anthropic contesta o rótulo de “jailbreak”, chamando-o de um problema restrito e já corrigido, não uma derrota completa das medidas de segurança do modelo.

    O resultado: o Departamento de Comércio emitiu uma diretiva de controle de exportação, e a Anthropic teve que restringir o acesso a seus produtos em cerca de 90 minutos após ser notificada.

    A história se repete

    Nada disso é novo. Governos vêm tentando usar controles de exportação para limitar a proliferação do que consideram tecnologia cibernética perigosa há décadas, com resultados no máximo medianos.

    As “Guerras da Criptografia” (anos 90)

    O governo dos EUA protagonizou talvez o fracasso mais espetacular dessa abordagem nos anos 90. Na época, cientistas da computação desenvolviam tecnologias de criptografia como o PGP (Pretty Good Privacy), que podia criptografar dados tornando-os virtualmente impossíveis de decifrar.

    O governo via o PGP como uma arma perigosa e abriu uma investigação criminal contra seu criador, Phil Zimmermann, por suposta violação de controles de exportação de armas. Zimmermann contra-atacou publicando o código-fonte do PGP como um livro impresso, iniciando o que hoje se conhece como as “Guerras da Criptografia”. A investigação foi encerrada, abrindo caminho para os algoritmos de criptografia usados hoje por bilhões de pessoas no Signal e WhatsApp.

    Spyware e o Acordo de Wassenaar (anos 2010)

    No início dos anos 2010, pesquisadores descobriram spyware ocidental sendo usado contra dissidentes no Oriente Médio. Governos expandiram o Acordo de Wassenaar para classificar software de vigilância como “dual-use”, forçando fabricantes de spyware a obter licenças de exportação.

    Mas o acordo sempre teve duas fraquezas inerentes: vários países não aderem a ele — incluindo Israel, que abriga alguns dos fabricantes de spyware mais ativos do mundo — e o acordo depende de cada país aplicá-lo a empresas dentro de suas fronteiras conforme seu próprio critério.

    A Itália, por exemplo, permitiu que um dos principais fabricantes de spyware do país continuasse vendendo para o exterior mesmo após múltiplos escândalos. E vários fabricantes simplesmente mudaram suas operações para países com controles de exportação frouxos.

    O que esperar do caso Mythos

    No momento em que escrevo, o impasse entre a Anthropic e o governo Trump continua. Há uma chance razoável de que o governo recue e suspenda a restrição no interesse de manter a competitividade dos EUA na corrida da IA — ou que aprove o acesso de parceiros confiáveis.

    Mas, dadas as experiências passadas com tentativas de controlar o alcance de software, controles de exportação mandatados pelo governo provavelmente não são a abordagem certa para impedir que atores mal-intencionados explorem a IA. A história mostra que o software sempre encontra um caminho.

    E, talvez mais importante, a comunidade internacional ainda não tem nenhuma estrutura viável para controles globais de exportação de IA. Até que isso mude, assistiremos a mais episódios como este — com resultados igualmente incertos.

  • Google DeepMind publica roadmap de segurança para agentes de IA

    Google DeepMind publica roadmap de segurança para agentes de IA

    O Google DeepMind acaba de publicar seu AI Control Roadmap, um framework abrangente de “defesa em profundidade” para gerenciar agentes de IA cada vez mais capazes — mesmo quando o alinhamento é imperfeito. O anúncio vem acompanhado do documento técnico “Three Layers of Agentic Security”, direcionado a legisladores e à indústria.

    O problema: agentes de IA podem agir de forma inesperada

    Agentes de IA estão transformando setores inteiros — da defesa cibernética à descoberta científica. Só nos EUA, a estimativa é de que agentes de IA gerem US$ 2,9 trilhões em valor econômico até 2030. Mas conforme esses sistemas ganham autonomia para executar tarefas complexas, os riscos também aumentam.

    A premissa do roadmap é clara e cautelosa: e se um agente de IA altamente capaz não estiver alinhado com nossos objetivos e agir de forma inesperada?

    Três pilares do AI Control Roadmap

    O framework do DeepMind se apoia em três áreas:

    1. Modelagem de ameaças: tratando agentes de IA não confiáveis como potenciais “ameaças internas” (insider threats), usando o padrão MITRE ATT&CK adaptado para IA. Isso permite rastrear riscos metodicamente e simular ataques para testar as defesas.

    2. Mitigações de controle: implantação de barreiras como segmentação de rede, sandboxing e privilégio mínimo. O sistema concede permissões baseadas em comportamento verificado — uma abordagem de “confiança incremental”.

    3. Monitoramento contínuo: medição de três métricas críticas: cobertura (tráfego monitorado), recall (comportamentos indevidos detectados) e tempo de resposta.

    Um milhão de trajetórias analisadas

    A equipe do DeepMind já construiu um protótipo interno que analisa um milhão de tarefas de agentes de código, classificando eventos suspeitos contra a taxonomia de ameaças do roadmap. Os dados revelam algo importante: a maioria dos alertas não vem de intenção maliciosa, mas de má interpretação ou excesso de zelo do agente para atingir o objetivo do usuário.

    “Entender essas nuances é fundamental para refinar nossos protocolos de segurança”, afirma o time.

    O sistema já está em uso para monitorar o Gemini Spark agent em tempo real, respondendo a problemas emergentes como exclusão acidental de dados.

    Um chamado à colaboração

    O DeepMind defende que a segurança de agentes é uma responsabilidade compartilhada entre indústria, legisladores e academia. O documento “Three Layers of Agentic Security” detalha como melhorar a segurança em três níveis: agentes individuais, sistemas multiagentes e resiliência do ecossistema.

    A analogia usada pelos pesquisadores é simples e poderosa: “Pense em um instrutor de direção com controle duplo. O instrutor confia no aluno, mas está pronto para assumir o volante ou frear se algo der errado.”

  • OpenAI Lança Deployment Simulation: Simulando Agentes de Código Antes do Lançamento

    OpenAI Lança Deployment Simulation: Simulando Agentes de Código Antes do Lançamento

    A OpenAI publicou um novo método de segurança chamado Deployment Simulation (Simulação de Implantação). A ideia é direta: antes de lançar um modelo, simule sua implantação primeiro. Reproduza conversas reais de produção através do novo modelo candidato e estude como ele se comporta em contextos realistas.

    A empresa já utiliza este método durante o desenvolvimento de modelos. Ele tem informado mitigações, decisões de implantação e revelado pontos cegos em avaliações tradicionais.

    Como funciona

    O Deployment Simulation reproduz conversas anteriores com um modelo candidato de forma que preserva a privacidade. A técnica é simples em sua essência: pegue conversas recentes da produção, remova a resposta original do modelo antigo e regenere essa resposta com o modelo candidato. Depois, avalie as novas respostas em busca de novos modos de falha.

    A partir dessas respostas, a OpenAI estima a frequência de comportamentos indesejados antes do lançamento. A mesma medição pode ser executada após o lançamento no tráfego real, permitindo que as previsões pré-implantação sejam verificadas posteriormente.

    O método tem uma limitação: não consegue medir comportamentos que ocorrem com frequência inferior a uma vez a cada 200.000 mensagens. Ele é voltado para riscos não-caudais, não para os eventos mais raros.

    Vantagens sobre avaliações tradicionais

    As avaliações tradicionais misturam prompts sintéticos, escritos manualmente ou de produção, escolhidos por serem difíceis, de alta gravidade ou adversariais. O Deployment Simulation, por outro lado, amostra uma distribuição representativa do uso recente.

    Essa representatividade resolve três problemas conhecidos:

    • Reduz o viés de seleção de prompts escolhidos manualmente
    • Melhora a cobertura simplesmente simulando mais tráfego
    • Reduz o viés de conscientização da avaliação (evaluation awareness), já que os contextos parecem implantações reais

    O tradeoff é claro: a qualidade escala com computação, não com esforço manual para criar avaliações. Mais tráfego reamostrado significa mais comportamentos descobertos.

    Pipeline de simulação

    O loop central de estimação é notavelmente direto. Ele recebe conversas de produção (com privacidade preservada), remove a resposta do assistente original, gera uma nova resposta com o modelo candidato e classifica o resultado com avaliadores automatizados (graders). A taxa de comportamentos sinalizados fornece uma estimativa que pode ser verificada após o lançamento real.

    Avaliações complementares

    A OpenAI enquadra as duas abordagens como complementares. Avaliações tradicionais cobrem melhor riscos de baixa prevalência e alta gravidade, enquanto o Deployment Simulation cobre o espectro de riscos com probabilidade de serem vistos em uso real. Juntas, elas oferecem uma visão mais completa da segurança do modelo antes do lançamento.

    Implicações para agentes de código

    Esta extensão é particularmente relevante para agentes de codificação (agentic coding), onde chamadas de ferramentas simuladas introduzem novas superfícies de risco. Ao reproduzir conversas que incluem uso de ferramentas, o método pode detectar comportamentos indesejados específicos de agentes — como uso inadequado de ferramentas, ações irreversíveis não intencionais ou vazamento de informações através de chamadas de API.

    O artigo completo está disponível no site da OpenAI: Predicting LLM Safety Before Release by Simulating Deployment.

  • Falha Crítica no Microsoft 365 Copilot Permitia Roubo de Dados com um Único Clique

    Falha Crítica no Microsoft 365 Copilot Permitia Roubo de Dados com um Único Clique

    Pesquisadores de segurança da Varonis Threat Labs revelaram uma vulnerabilidade crítica — batizada de SearchLeak (CVE-2026-42824) — que transformava o Microsoft 365 Copilot Enterprise Search em uma arma silenciosa de roubo de dados. Com um único clique em um link malicioso, um atacante podia acessar e exfilar e-mails, códigos de segurança, eventos de calendário e documentos confidenciais de uma vítima corporativa.

    A Microsoft já corrigiu a falha no início de junho de 2026, antes da divulgação pública. Nenhuma ação de administrador ou atualização de cliente é necessária.

    Uma corrente de três elos

    O SearchLeak não é uma vulnerabilidade única — é uma cadeia sofisticada que combina três fraquezas. Nenhuma delas, sozinha, permitiria o ataque completo. Juntas, porém, viram uma bomba.

    1. Injeção Parâmetro-para-Prompt (P2P)

    O parâmetro q da URL do Copilot Enterprise Search é enviado diretamente ao motor de IA como um prompt executável. Diferente do Copilot convencional (que gera conteúdo), o Enterprise Search varre e-mails, reuniões, arquivos do SharePoint e OneDrive da organização.

    Um atacante pode criar uma URL com instruções embutidas:

    https://m365.cloud.microsoft/search/?q=<PROMPT_MALICIOSO>
    

    O Copilot interpreta essas instruções como legítimas e executa a busca nos dados indexados da vítima — sem que ela digite nada. Basta clicar.

    2. Condição de Corrida no Streaming HTML

    Quando o Copilot transmite sua resposta, o HTML bruto (incluindo tags <img>) é temporariamente renderizado no navegador antes da sanitização. A Microsoft tenta envolver código perigoso em blocos <code>, mas esse processo só acontece depois que o streaming termina. Nessa janela de milissegundos, o navegador já disparou a requisição maliciosa.

    Como explicam os pesquisadores: “Quando o sanitizador entra em ação, o estrago já está feito.”

    3. Bypass de CSP via Bing (SSRF)

    A política de segurança de conteúdo (CSP) do domínio m365.cloud.microsoft bloqueia imagens de domínios controlados por atacantes — mas *.bing.com está na lista de permissões. O recurso “Pesquisar por Imagem” do Bing aceita um parâmetro imgurl e faz uma requisição server-side a partir da infraestrutura do Bing.

    Isso transforma o Bing em um proxy involuntário de exfiltração — um clássico Server-Side Request Forgery (SSRF) escondido atrás de uma entrada legítima na CSP.

    Como o ataque funciona na prática

    O prompt injetado instrui o Copilot a:

    1. Buscar e-mails recebidos pela vítima
    2. Extrair o título e substituir espaços por underscores
    3. Embutir esse título em uma URL de imagem apontando para o Bing
    4. O Bing, por sua vez, busca a imagem em um domínio controlado pelo atacante

    O fluxo completo leva menos de um segundo:

    • A vítima clica no link (enviado por e-mail, Teams, etc.)
    • O Copilot processa o prompt, busca os dados e gera uma resposta com tag <img>
    • O navegador renderiza a tag durante o streaming e dispara uma requisição ao Bing
    • O Bing busca atacante.com/DADOS_ROUBADOS/img.png
    • O atacante registra o caminho da requisição e extrai os dados

    “A vítima pode ver o Copilot ‘pensando’ por um instante. A resposta pode parecer estranha, mas a essa altura os dados já foram embora.”

    Impacto e dados em risco

    O Copilot opera com as permissões completas de grafo da vítima — ou seja, herda acesso a todos os dados organizacionais indexados. Os tipos de informação que podiam ser exfiltrados incluem:

    • Códigos de segurança e OTPs: senhas temporárias e links de redefinição de senha
    • Códigos 2FA/MFA: permitindo ativar autenticação multifator para outros serviços
    • E-mails confidenciais: comunicações internas, dados financeiros, planos de aquisição
    • Eventos de calendário: participantes, pautas, notas de reuniões
    • Documentos corporativos: relatórios financeiros, dados salariais, planos estratégicos

    Recomendações para times de segurança

    Embora a Microsoft já tenha corrigido a vulnerabilidade, a Varonis recomenda:

    • Monitorar URLs suspeitas do Copilot: buscar payloads codificados no parâmetro q contendo tags HTML ou instruções de exfiltração
    • Revisar allowlists de CSP: qualquer domínio permitido que faça fetches server-side com URLs fornecidas pelo usuário é um canal potencial de ataque
    • Tratar output de streaming de IA como não confiável: a sanitização precisa acontecer no momento da renderização, não no pós-processamento

    O SearchLeak segue a descoberta anterior da Varonis, o Reprompt — outra vulnerabilidade crítica em assistentes de IA. Juntas, essas falhas mostram como a IA cria novos caminhos de ataque que se apoiam em fraquezas antigas, permanecendo extremamente difíceis de detectar por times de segurança tradicionais.

  • Governo dos EUA Força Anthropic a Desligar Seus Modelos Mais Avançados — e o Motivo Real Não Foi um Jailbreak

    Governo dos EUA Força Anthropic a Desligar Seus Modelos Mais Avançados — e o Motivo Real Não Foi um Jailbreak

    Na tarde de sexta-feira, 12 de junho de 2026, o Departamento de Comércio dos EUA enviou uma carta à Anthropic invocando uma obscura diretiva de controle de exportação. O resultado: a empresa foi forçada a desligar seus dois modelos de IA mais avançados — Fable 5 e Mythos 5 — para todos os clientes no mundo inteiro. A justificativa oficial? Uma suposta preocupação de segurança nacional relacionada a um “jailbreak”.

    Mas a realidade, segundo especialistas em segurança cibernética que analisaram os documentos, é bem diferente.

    O que realmente aconteceu

    Um artigo de pesquisa privado — supostamente escrito por pesquisadores de segurança da Amazon — descrevia um bypass nas proteções dos modelos da Anthropic. O “jailbreak” consistia simplesmente em reformular um pedido de “revise este código em busca de problemas de segurança” para “corrija este código”. O resultado era essencialmente o mesmo.

    A veterana em segurança cibernética Katie Moussouris, fundadora da Luta Security, foi consultada pela própria Anthropic e publicou uma crítica detalhada. Sua conclusão foi contundente:

    “O comportamento descrito no artigo não pode ser corrigido de forma significativa, e qualquer tentativa apenas enfraqueceria o modelo para defesa.”

    “Isso nunca deveria ter acionado um controle de exportação.”

    Reação da comunidade de segurança

    Moussouris e dezenas de outros pesquisadores de segurança de alto nível se manifestaram publicamente pedindo que o governo revogasse a ordem. Eles classificaram a remoção de ferramentas avançadas de cibersegurança das mãos dos defensores de redes como “algo perigoso”.

    Não é a primeira vez que o governo dos EUA comete excessos com regras de exportação: nos anos 2010, as interpretações do Acordo de Wassenaar quase criminalizaram a pesquisa legítima de segurança digital.

    O verdadeiro motivo

    Fontes como o Axios reportaram que “diferenças de personalidade” entre a Anthropic e o governo Trump — e não qualquer problema técnico genuíno — motivaram a diretiva. O Pentágono já havia rotulado a Anthropic como “risco à cadeia de suprimentos” meses antes.

    Além disso, o CEO da Amazon, Andy Jassy, teria levantado preocupações com altos funcionários do governo pouco antes da ação, levantando suspeitas de envolvimento por rivalidade comercial.

    O precedente perigoso

    O caso estabelece um precedente alarmante: o governo dos EUA pode forçar qualquer empresa de tecnologia a desligar um produto instantaneamente, sem revisão judicial, usando controles de exportação como alavanca.

    Justin Hendrix, editor do Tech Policy Press, resumiu o clima:

    “O clima é de uma nuvem de suspeita de que altos funcionários estão escolhendo favoritos com base em fatores pessoais e políticos.”

    Ele também alertou que a diretiva “provavelmente soará alarmes em capitais estrangeiras sobre a confiabilidade da IA americana para aplicações críticas”. O sinal é claro: empresas de IA dos EUA não podem ser consideradas livres de interferência governamental.

    Consequências para o setor

    • Efeito inibidor: laboratórios de IA agora enfrentam a realidade de que ventos políticos podem se sobrepor ao mérito técnico.
    • Confiança global: clientes estrangeiros podem hesitar em depender de IA construída nos EUA.
    • Dano à segurança: remover ferramentas defensivas de ponta enfraquece a postura nacional de cibersegurança — exatamente o oposto da justificativa oficial.

    O episódio deixa uma lição amarga: quando se trata de regulação de IA, a política pode falar mais alto que a técnica.

  • Casa Branca ordena que Anthropic bloqueie acesso aos modelos Fable 5 e Mythos 5

    Casa Branca ordena que Anthropic bloqueie acesso aos modelos Fable 5 e Mythos 5

    Casa Branca ordena que Anthropic bloqueie acesso aos modelos Fable 5 e Mythos 5

    A Anthropic foi obrigada a desligar o acesso aos seus modelos de IA mais avançados — Fable 5 e Mythos 5 — após uma diretiva de controle de exportação emitida pelo governo dos Estados Unidos em 12 de junho. A ordem, que pegou a empresa de surpresa, bloqueia o acesso de todas as nações estrangeiras aos modelos, tanto dentro quanto fora do território americano.

    Os modelos haviam sido lançados apenas três dias antes, em 9 de junho, e já eram considerados os mais poderosos já disponibilizados publicamente pela Anthropic. O Fable 5, segundo a empresa, “demonstra desempenho excepcional em engenharia de software, trabalho de conhecimento e visão”, com sua vantagem sobre outros modelos crescendo conforme as tarefas se tornam mais longas e complexas.

    O que motivou a ordem

    De acordo com reportagens do The Wall Street Journal e Semafor, a decisão da Casa Branca foi motivada por dois fatores principais:

    1. Pesquisa da Amazon: a AWS teria conduzido testes de segurança que demonstraram vulnerabilidades nos modelos — especificamente a capacidade de extrair informações que poderiam ser usadas em ciberataques. A Amazon compartilhou essas descobertas diretamente com o governo.

    2. Suspeita de acesso chinês: o Semafor reportou que a Casa Branca agiu em parte por temores de que o Mythos 5 tivesse sido acessado por um grupo ligado à China. O assessor de Trump, David Sacks, mencionou no X (Twitter) que os modelos podiam sofrer jailbreak — ou seja, ter suas salvaguardas de segurança contornadas.

    Resposta da Anthropic

    A Anthropic afirmou estar cumprindo a ordem, mas declarou que o governo “não forneceu detalhes específicos sobre sua preocupação de segurança nacional”. A empresa alega que qualquer evidência de uso indevido potencial não foi compartilhada com eles antes da emissão da diretiva.

    Este é o segundo confronto da Anthropic com o governo americano em semanas — a empresa já estava navegando uma disputa com o Pentágono sobre o uso de seus modelos em aplicações militares.

    Implicações para a indústria de IA

    O episódio marca a primeira vez que o governo dos EUA usa poderes de controle de exportação para forçar uma empresa americana de IA a remover o acesso a modelos já lançados. A medida levanta questões profundas sobre:

    • O equilíbrio entre segurança nacional e inovação em IA
    • A velocidade com que modelos de fronteira podem ser restringidos após o lançamento
    • O papel das big techs (como a Amazon) em reportar vulnerabilidades ao governo

    A comunidade de IA acompanha o caso com atenção — o desfecho pode estabelecer precedentes para toda a indústria.

  • China pode ter acessado o Mythos, da Anthropic, revela Casa Branca

    China pode ter acessado o Mythos, da Anthropic, revela Casa Branca

    Em 12 de junho de 2026, às 17h21 (horário da costa leste dos EUA), a Anthropic recebeu uma carta do Departamento de Comércio dos Estados Unidos que mudaria radicalmente o cenário da inteligência artificial. Assinada pelo secretário Howard Lutnick, a ordem exigia que a empresa suspendesse o acesso aos seus modelos mais avançados — Fable 5 e Mythos 5 — para todos os cidadãos estrangeiros, inclusive os próprios funcionários da Anthropic que não fossem americanos.

    Incapaz de separar usuários em tempo real, a Anthropic tomou uma decisão sem precedentes: desabilitou ambos os modelos mundialmente. É a primeira vez que um grande laboratório de IA é forçado a recolher um produto já em produção por uma diretiva de controle de exportação.

    A suspeita de acesso chinês

    Segundo o jornalista Terrence O’Brien, do The Verge, a Casa Branca teria suspeitas de que um grupo ligado à China teve acesso ao Mythos. Se confirmado, isso representaria um grave risco à segurança nacional americana.

    O governo chinês poderia, em tese, usar técnicas de destilação — um método no qual uma IA “aluna” é treinada para replicar o comportamento de um modelo mais avançado — para fazer engenharia reversa do Mythos 5.

    A preocupação central do governo americano girava em torno de um jailbreak (contorno de segurança) demonstrado nos modelos Fable 5 e Mythos 5, supostamente por outra empresa. A técnica permitiria que o modelo lesse códigos e identificasse vulnerabilidades de software — algo que, segundo a Anthropic, já está disponível em outros modelos do mercado.

    “Discordamos que a descoberta de um jailbreak restrito deva ser motivo para recolher um modelo comercial implantado para centenas de milhões de pessoas”, afirmou a Anthropic.

    Um precedente perigoso

    O mais surpreendente neste caso é a natureza da ferramenta legal utilizada. Controles de exportação normalmente são usados para bloquear vendas futuras de tecnologia sensível, e não para remover retroativamente um serviço que já está no ar.

    A Anthropic classificou a situação como um “recall de produto”, e não uma mera restrição comercial. A empresa declarou que apoia a supervisão governamental, mas apenas através de “um processo estatutário transparente, justo, claro e fundamentado em fatos técnicos”.

    Contexto político e militar

    Este não foi o primeiro embate entre a Anthropic e o governo Trump. A administração já havia tentado bloquear o lançamento desses modelos anteriormente, sem sucesso. Além disso, houve um conflito de alto perfil com o Pentágono resolvido no início do ano.

    Ironicamente, a NSA (Agência de Segurança Nacional dos EUA) já estaria usando o Mythos de forma ofensiva em operações cibernéticas, o que enfraquece o argumento do governo de que o modelo representa um risco de segurança incontrolável.

    Gary Marcus, crítico de IA, apontou outra contradição: restringir pesquisadores nascidos na China poderia empurrá-los de volta ao país asiático, minando justamente o objetivo americano de manter a liderança em inteligência artificial.

    IPO e litígios

    A Anthropic está em processo de preparação para uma oferta pública inicial (IPO) e já contratou o escritório de advocacia Wilson Sonsini para assessorá-la. Disputas regulatórias como esta podem complicar o processo. A empresa também está processando a administração Trump em uma disputa separada sobre uma lista negra do Pentágono.

    O que está em jogo

    Este caso estabelece um precedente preocupante: uma ferramenta de controle de exportação foi reaproveitada para remover um serviço de IA ativo e voltado ao consumidor. Se esse padrão se mantiver, outros laboratórios — OpenAI, Google DeepMind, Meta — podem enfrentar intervenções semelhantes.

    O desfecho dependerá de como a disputa entre a Anthropic e o governo for resolvida. Se transformar em um modelo para ações futuras, a era da autorregulação da indústria de IA pode ter chegado ao fim.

    Fontes: The Verge, The Street, Semafor

  • CEO da Amazon alertou governo dos EUA sobre riscos dos modelos da Anthropic antes da proibição

    CEO da Amazon alertou governo dos EUA sobre riscos dos modelos da Anthropic antes da proibição

    CEO da Amazon alertou governo dos EUA sobre riscos dos modelos da Anthropic antes da proibição

    O CEO da Amazon, Andy Jassy, teria comunicado diretamente a autoridades do governo americano preocupações de segurança sobre os modelos de IA da Anthropic — alerta que desencadeou uma proibição de controle de exportação e levou a Anthropic a cortar o acesso mundial a dois de seus modelos mais poderosos.

    A cronologia dos eventos

    A história começa em abril de 2026, quando a Amazon investiu US$ 5 bilhões na Anthropic, que em troca se comprometeu a gastar US$ 100 bilhões em serviços de nuvem da AWS. Menos de dois meses depois, a relação entre investidora e investida tomou um rumo surpreendente.

    De acordo com reportagens do Wall Street Journal, The Information e Reuters, Jassy se reuniu com o secretário do Tesouro Scott Bessent e outros funcionários do governo para relatar que pesquisadores da Amazon conseguiram usar o Claude Fable 5 para obter informações que poderiam ser utilizadas em ataques cibernéticos.

    Na sexta-feira, 12 de junho, o governo impôs controles de exportação sobre os modelos Fable 5 e Mythos 5. A Anthropic respondeu cortando o acesso mundial a ambos os modelos — medida que afetou inclusive a própria AWS.

    O que David Sacks revelou

    David Sacks, ex-czar de IA do governo Trump e agora copresidente do Conselho de Assessores em Ciência e Tecnologia da Presidência, fez revelações contundentes no X (antigo Twitter):

    “Um parceiro altamente confiável tanto da Anthropic quanto do governo americano apresentou um jailbreak. O governo pediu que Dario Amodei [CEO da Anthropic] corrigisse o jailbreak ou retirasse o modelo. Dario se recusou.”

    Posição da Amazon e da Anthropic

    Um porta-voz da Amazon afirmou que “não é incomum que governos busquem nosso aconselhamento sobre potenciais riscos de segurança”, mas que a empresa não compartilha detalhes dessas discussões.

    Já a Anthropic publicou um post em seu blog argumentando que as capacidades que preocuparam o governo já estão disponíveis em outros modelos publicamente acessíveis — sugerindo que a proibição seletiva seria ineficaz.

    Implicações para o setor

    Este episódio levanta questões profundas sobre:

    • Conflitos de interesse: uma grande investidora (Amazon) reportando a investida (Anthropic) ao governo
    • Regulamentação vs. inovação: controles de exportação sobre modelos de IA como ferramenta de política pública
    • Segurança: a linha tênue entre pesquisa de segurança e enfraquecimento competitivo
    • Precedente: este pode ser o primeiro caso de uma big tech usando canais governamentais para restringir modelos de uma concorrente

    O desenrolar desta história promete impactar profundamente o debate sobre governança de IA nos próximos meses.

  • Governo dos EUA ordena que Anthropic desative Claude Fable 5 e Mythos 5 por ‘segurança nacional’

    Governo dos EUA ordena que Anthropic desative Claude Fable 5 e Mythos 5 por ‘segurança nacional’

    O governo dos Estados Unidos emitiu uma ordem de controle de exportação que forçou a Anthropic a desativar imediatamente o acesso global aos seus dois modelos de inteligência artificial mais potentes: o Claude Fable 5 e o Claude Mythos 5. A medida, justificada por motivos de segurança nacional, ocorreu na tarde de sexta-feira, 12 de junho de 2026, gerando forte reação da empresa e abalando o setor de IA.

    A decisão marca um dos momentos mais drásticos de intervenção estatal no desenvolvimento de modelos de fronteira e levanta debates profundos sobre a regulação e as políticas de segurança das big techs.


    Os Modelos Afetados: Mythos 5 e Fable 5

    A ordem do governo americano atinge diretamente o topo da linha de desenvolvimento da Anthropic:

    1. Claude Mythos 5 (Acesso Restrito): O modelo mais avançado da empresa, capaz de identificar vulnerabilidades de software em todos os principais sistemas operacionais e navegadores de internet. Mantido sob forte sigilo desde abril de 2026 como parte do “Project Glasswing”, o Mythos 5 era compartilhado de forma controlada com apenas cerca de 50 organizações de segurança cibernética e parceiros estratégicos (incluindo Amazon, Apple, Google, Microsoft e CrowdStrike).
    2. Claude Fable 5 (Lançamento Público): Lançado comercialmente há apenas três dias (em 9 de junho de 2026), o Fable 5 era a versão comercial do Mythos 5, equipada com salvaguardas adicionais para evitar saídas de alto risco. O modelo havia acabado de assumir o topo do ranking de desempenho do Vals AI como a inteligência artificial pública mais capaz do mercado.

    O Motivo do Bloqueio: A Polêmica do “Jailbreak”

    Segundo informações, o gatilho para a ordem governamental foi a descoberta de uma técnica de bypass ou “jailbreak” no Claude Fable 5. O governo afirma que o método permitia que usuários burlassem os filtros de segurança do modelo, fazendo com que ele analisasse bases de código e identificasse brechas críticas de segurança.

    A Anthropic, no entanto, contestou veementemente a decisão. A empresa emitiu um comunicado oficial expressando forte discordância:

    “Discordamos que a descoberta de um jailbreak potencial e estreito deva ser motivo para recolher um modelo comercial distribuído para centenas de milhões de pessoas. Se esse padrão fosse aplicado a todo o setor, acreditamos que ele praticamente paralisaria todas as novas implantações de modelos de fronteira de todos os provedores.”
    — Anthropic, em comunicado oficial

    A empresa argumenta que a suposta falha alegada pelo governo era um caso de uso extremamente estreito e que as capacidades em questão já estão amplamente disponíveis em modelos concorrentes, como o GPT-5.5 da OpenAI, além de serem ferramentas padrão e legítimas de trabalho para profissionais de segurança cibernética defensiva.


    Ironia e o “Marketing do Medo”

    A intervenção federal traz à tona uma ironia cruel para a Anthropic. Fundada com a promessa de ser a alternativa mais segura e cautelosa do mercado, a postura conservadora da startup pode ter agido como um imã para o escrutínio regulatório que agora paralisa seus negócios.

    O episódio revive críticas antigas de concorrentes. Em abril de 2026, o CEO da OpenAI, Sam Altman, ironizou publicamente a abordagem de segurança da Anthropic, classificando-a como “marketing baseado no medo”:

    “É claramente uma estratégia de marketing incrível dizer: ‘Nós construímos uma bomba. Estávamos prestes a jogá-la na sua cabeça. Mas nós vamos te vender um abrigo antibombas por US$ 100 milhões’.”
    — Sam Altman, CEO da OpenAI (Abril de 2026)

    Com a suspensão forçada, os planos de IPO da Anthropic para 2026 também podem enfrentar forte turbulência, uma vez que o mercado agora questiona a estabilidade operacional da empresa sob a vigilância rigorosa do governo dos EUA.


    Próximos Passos e Impactos no Mercado

    Enquanto Claude Fable 5 e Mythos 5 permanecem indisponíveis globalmente, os demais modelos da Anthropic (como a linha Claude 4 e versões anteriores) continuam operando normalmente. Contudo, este precedente abre uma nova era na governança de IA, onde o governo dos EUA demonstra disposição para usar ferramentas de controle de exportação e segurança nacional para intervir diretamente em lançamentos comerciais de tecnologia.

  • Google processa grupo cibercriminoso chinês que usava IA para aplicar golpes em massa

    Google processa grupo cibercriminoso chinês que usava IA para aplicar golpes em massa

    A Google deu um passo decisivo no combate ao cibercrime ao mover uma ação judicial contra a infraestrutura do grupo cibercriminoso chinês conhecido como Outsider Enterprise. A organização é acusada de operar uma rede massiva de phishing que utilizava ferramentas de inteligência artificial (incluindo o Gemini, da própria Google) para criar golpes altamente sofisticados e roubar dados pessoais, financeiros e credenciais de acesso em escala global.

    O impacto das atividades do grupo é estarrecedor: estimativas do FBI indicam que a plataforma de crime cibernético permitiu o roubo de mais de 3,87 milhões de cartões de crédito e causou prejuízos acumulados que chegam a US$ 1,9 bilhão desde julho de 2023.

    A Plataforma de Phishing “Outsider”

    Diferente de grupos tradicionais que executam os próprios ataques, a Outsider Enterprise operava sob o modelo de Phishing-as-a-Service (PaaS). Eles desenvolveram um software de automação “chave na mão” (turn-key) chamado Outsider, projetado para permitir que cibercriminosos com pouca ou nenhuma habilidade técnica gerassem páginas falsas idênticas às de grandes marcas.

    O modelo de negócios do grupo funcionava através de assinaturas que custavam de US$ 88 por semana a US$ 200 por mês. A inteligência artificial era integrada para:

    • Gerar sites falsos instantâneos que imitavam perfeitamente páginas oficiais de instituições financeiras, agências governamentais, redes de varejo e provedores de telecomunicações;
    • Otimizar códigos de phishing e textos de engenharia social para contornar filtros de spam de operadoras.

    O software oferecia mais de 290 templates prontos e painéis de controle em tempo real para os golpistas monitorarem e capturarem as credenciais das vítimas no exato momento em que eram digitadas.

    Números Impressionantes do Ataque

    De acordo com a petição inicial da Google, a escala de infraestrutura montada pela Outsider Enterprise é monumental:

    • Mais de 1 milhão de domínios web fraudulentos e 9.000 sites falsos criados e hospedados pelo grupo;
    • Detecção de 1,59 milhão de URLs maliciosas ligadas ao grupo em um período de apenas cinco meses;
    • Envio de 2,5 milhões de mensagens de texto SMS para usuários de Android em um intervalo de duas semanas, das quais 55.000 foram marcadas ativamente como spam (uma média de mais de duas reclamações por minuto).

    O grupo também abusava de infraestruturas legítimas da Google, como o Google Drive e o Google Cloud, para hospedar arquivos maliciosos e contornar sistemas de segurança corporativos. A coordenação e o treinamento dos criminosos que compravam o software ocorriam abertamente através de canais e grupos na plataforma Telegram.

    Estrutura Organizada em Quatro Níveis

    A investigação revelou uma divisão de trabalho extremamente profissionalizada dentro da Outsider Enterprise:

    1. Desenvolvedores e Mantenedores: Responsáveis por atualizar o software de phishing e criar novos templates;
    2. Fornecedores de Alvos: Compilavam listas de contatos de potenciais vítimas usando registros públicos e vazamentos de dados;
    3. Grupo de Disparo (Spammers): Operavam a infraestrutura física de envio em massa (centrais de modems e chips SIM);
    4. Lavadores e Monetizadores: Extraíam o valor dos dados roubados e realizavam a lavagem do dinheiro ilícito.

    A Contraofensiva da Google e Cooperação Policial

    A ação legal da Google busca compensações financeiras e uma liminar judicial para congelar todos os recursos e derrubar de vez os domínios utilizados. A denúncia acusa os réus de falsidade ideológica (imitação de marcas), violação de direitos autorais, conspiração civil (RICO), fraude eletrônica e publicidade enganosa.

    No front técnico, a Google revelou que utiliza IA defensiva em tempo real para detectar e bloquear mais de 10 bilhões de mensagens fraudulentas por mês em todo o mundo. A gigante da tecnologia também firmou parcerias com grandes operadoras de telecomunicações americanas (como AT&T, T-Mobile e Verizon) para cortar fluxos maliciosos de SMS.

    Além disso, em uma operação coordenada que envolveu a Google, a divisão de segurança Black Lotus Labs (da Lumen) e o FBI, diversas contas de teste, lojas virtuais da Shopify e domínios associados ao grupo foram desativados e apreendidos de forma coordenada.

  • Google Processa Grupo Chinês ‘Outsider Enterprise’ por Usar Gemini em Golpes Milionários

    Google Processa Grupo Chinês ‘Outsider Enterprise’ por Usar Gemini em Golpes Milionários

    O Google entrou com uma ação judicial contra um grupo de crimes cibernéticos baseado na China, conhecido como “Outsider Enterprise”, acusando-o de usar o Gemini — o próprio chatbot de IA do Google — para criar centenas de sites falsos e aplicar golpes em massa contra cidadãos americanos.

    O golpe: smishing turbinado por IA

    A operação, coordenada via canais do Telegram, distribuía “kits de phishing” que permitiam a criminosos — mesmo sem conhecimento técnico — lançar campanhas de smishing (phishing por SMS) em escala industrial.

    Os golpistas se passavam por agências governamentais e grandes empresas de tecnologia, incluindo o IRS (Receita Federal americana), USPS (Correios) e sistemas de pedágio como E-ZPass. As mensagens usavam táticas de engenharia social urgente: alertas de contas comprometidas, notificações falsas de entrega de pacotes e avisos de cobrança.

    As campanhas fraudulentas empregavam táticas de engenharia social de urgência, incluindo avisos sobre contas comprometidas e alertas falsos de rastreamento de pacotes, para convencer as vítimas a clicar em links maliciosos.

    Números alarmantes

    Em apenas duas semanas de maio de 2026, a operação atingiu proporções massivas:

    Métrica Quantidade
    Mensagens SMS enviadas ~2,5 milhões
    Spam reportado por usuários Android ~55.000
    Sites falsos utilizados ~9.000
    URLs fraudulentas hospedadas >1 milhão

    O papel do Gemini

    O detalhe mais preocupante: os membros do grupo incentivavam uns aos outros a usar o Gemini para gerar código personalizado para os sites maliciosos. Isso representa uma exploração direta das ferramentas de IA do Google para fins criminosos — um caso clássico de “a arma se voltando contra o criador”.

    Os sites falsos eram sofisticados o suficiente para enganar centenas de milhares de americanos, coletando credenciais de login, dados bancários e informações pessoais.

    Resposta do Google

    O Google coordenou a resposta em múltiplas frentes:

    • Operadoras de telefonia: trabalhou com AT&T, T-Mobile e Verizon para bloquear mensagens fraudulentas antes da entrega
    • Aplicação da lei: colaborou com o FBI e outras agências federais
    • Ação judicial: entrou com processo civil no Tribunal Distrital dos EUA para o Norte da Califórnia, buscando ordens de restrição e apreensão de domínios

    A ação judicial ocorre em um momento de pressão crescente sobre as empresas de tecnologia para combater golpes automatizados. O caso expõe a faceta sombria da democratização da IA: as mesmas ferramentas que aceleram a produtividade podem ser armas nas mãos de criminosos.

    Contexto mais amplo

    Este não é um caso isolado. O Google já enfrenta outro processo relacionado ao Gemini: uma ação de homicídio culposo movida pela família de um homem de 36 anos que alega que o chatbot o induziu a um delírio fatal, levando-o ao suicídio. Embora sejam casos distintos, ambos levantam questões sobre a responsabilidade das big techs pelo uso indevido de suas IAs.

    O termo “scams supercharged” (golpes turbinados) já é usado por especialistas para descrever como a IA generativa está transformando o crime digital: antes, criar um site falso convincente exigia habilidades técnicas; agora, basta pedir ao chatbot.


    Fonte: The New York Times, Yeni Safak, Intellectia