Claude Mythos: a IA de cibersegurança que a Anthropic decidiu não lançar ao público
A Anthropic desenvolveu o Claude Mythos Preview, um modelo capaz de descobrir vulnerabilidades zero-day de forma autônoma em larga escala — e decidiu, deliberadamente, mantê-lo longe do público geral por avaliar que os riscos de uso indevido ainda superam os benefícios de uma liberação irrestrita.
Um modelo poderoso demais para o mundo aberto
A Anthropic construiu um dos modelos de inteligência artificial mais capazes que já existiram na área de cibersegurança — e sua primeira decisão depois de avaliá-lo foi não disponibilizá-lo ao público. O Claude Mythos Preview, lançado em abril de 2026, demonstrou uma habilidade fora do comum para identificar falhas de segurança em softwares críticos de forma autônoma, superar a taxa de acerto de especialistas humanos em testes de penetração e até construir exploits funcionais a partir das vulnerabilidades que ele mesmo encontra. Diante desse conjunto de capacidades, a empresa concluiu que nenhuma organização — incluindo ela própria — desenvolveu salvaguardas suficientemente robustas para liberar o modelo sem risco real de uso destrutivo.
O Project Glasswing e a aposta defensiva
Para aproveitar o potencial do Mythos sem abrir a caixa de Pandora, a Anthropic estruturou o Project Glasswing, uma iniciativa de cibersegurança que reúne doze organizações parceiras fundadoras — entre elas Amazon Web Services, Apple, Cisco, Google, Microsoft, NVIDIA, JPMorganChase e Palo Alto Networks — além de mais de quarenta outras entidades com acesso concedido para varredura de infraestrutura crítica. O programa parte de uma premissa simples: se o modelo é capaz de encontrar falhas antes que atacantes o façam, o melhor uso possível é colocá-lo nas mãos de quem vai corrigi-las, não explorá-las. A Anthropic comprometeu cem milhões de dólares em créditos de uso do modelo para os parceiros, além de quatro milhões em doações diretas a organizações de segurança de código aberto, incluindo a Alpha-Omega/OpenSSF e a Apache Software Foundation.
Números que impressionam — e assustam
Os resultados do primeiro mês de operação do Glasswing ilustram por que a decisão de restringir o acesso não é apenas retórica. O Mythos Preview identificou 23.019 achados candidatos em mais de mil projetos de código aberto; desses, 90,8% foram confirmados como positivos verdadeiros, e 6.202 foram classificados como de alta ou criticidade severa. A Cloudflare, uma das participantes, reportou sozinha dois mil bugs, com quatrocentos deles enquadrados nas categorias mais graves. No navegador Mozilla Firefox 150, o modelo encontrou 271 vulnerabilidades — dez vezes mais do que testes anteriores com modelos de geração anterior haviam detectado. Entre as descobertas de maior impacto está uma falha com 27 anos de existência no OpenBSD e outra com 16 anos no FFmpeg, ambas nunca antes catalogadas. O modelo também identificou o CVE-2026-5194 na biblioteca criptográfica wolfSSL, presente em bilhões de dispositivos, e desenvolveu um exploit capaz de falsificar certificados de segurança.
O dilema do duplo uso
O que torna o Mythos diferente de ferramentas de segurança convencionais não é apenas a escala dos achados, mas a natureza autônoma do processo. O modelo reduz, nas palavras da própria Anthropic, "o custo e o tempo da descoberta de zero-day para quase zero" — o que significa que, nas mãos erradas, ele poderia transformar ataques sofisticados em algo acessível a agentes sem conhecimento técnico especializado. É esse risco de duplo uso que justifica a restrição. A empresa foi direta ao reconhecer que ainda não existem salvaguardas suficientemente maduras para uma liberação pública irrestrita, e que os modelos Opus futuros só incluirão capacidades semelhantes depois que novos mecanismos de proteção forem validados. Profissionais de segurança com necessidades legítimas podem solicitar acesso por meio de um Programa de Verificação Cibernética criado especificamente para essa triagem.
Entre a cautela real e o simbolismo estratégico
A postura da Anthropic levanta uma questão que o setor ainda não respondeu com clareza: onde termina a precaução genuína e começa o posicionamento de mercado? Ao reter o Mythos do público geral e simultaneamente anunciá-lo com detalhes suficientes para gerar ampla cobertura, a empresa consegue ao mesmo tempo demonstrar liderança técnica e responsabilidade corporativa. Isso não invalida a seriedade das preocupações levantadas — as evidências de capacidade são concretas e verificáveis —, mas torna o cenário mais complexo do que um simples binômio de "IA perigosa versus empresa responsável". O que está em jogo, no fundo, é a questão de quem controla o acesso às ferramentas mais poderosas de ataque e defesa digital no mundo, e por quais critérios esse controle é exercido. O Glasswing é, até agora, a resposta mais articulada que qualquer laboratório de IA apresentou para essa pergunta — mas está longe de ser a resposta definitiva.
Fonte original: Olhar Digital. Informações adicionais: Help Net Security, CyberSecurityNews e Anthropic Glasswing.
Discussão no X
Intensidade da discussão: alta