Tag: IA

Claude-Mem: a â€œmemÃ³ria infinitaâ€ que faz o Claude Code lembrar do que jÃ¡ fez
Meta description: ConheÃ§a o Claude-Mem, a camada de memÃ³ria persistente para Claude Code que registra o que o agente fez, comprime o histÃ³rico com IA e injeta apenas o contexto relevante nas prÃ³ximas sessÃµes.

Claude-Mem: a â€œmemÃ³ria infinitaâ€ que faz o Claude Code lembrar do que jÃ¡ fez

Se vocÃª jÃ¡ usou um assistente de programaÃ§Ã£o por mais de uma sessÃ£o, provavelmente viveu este cenÃ¡rio: o trabalho anda, a conversa cresce, e depois o sistema parece esquecer decisÃµes importantes. O Claude-Mem foi criado para resolver exatamente isso. Ele adiciona uma camada de memÃ³ria persistente ao Claude Code â€” e tambÃ©m a outras ferramentas compatÃveis â€” para que o agente consiga continuar projetos sem comeÃ§ar do zero a cada nova conversa.

Em linguagem simples: o Claude-Mem guarda o que foi aprendido, organiza esse histÃ³rico de forma inteligente e devolve sÃ³ o que importa quando o trabalho continua. O resultado Ã© um uso muito mais eficiente do contexto e, consequentemente, menos desperdÃcio de tokens. A documentaÃ§Ã£o do projeto destaca uma abordagem em camadas que pode trazer cerca de 10x de economia em relaÃ§Ã£o a mÃ©todos tradicionais. Em situaÃ§Ãµes prÃ¡ticas, isso ajuda bastante a reduzir custo, ruÃdo e retrabalho â€” e pode chegar muito perto daquela sensaÃ§Ã£o de â€œquase nÃ£o gastei contexto nenhumâ€.

O problema que ele resolve

Modelos de IA sÃ£o Ã³timos para raciocinar, mas tÃªm um problema estrutural: o contexto Ã© limitado e caro. Se vocÃª coloca tudo dentro da janela de conversa, gasta tokens demais. Se coloca pouco, o agente esquece. O Claude-Mem tenta resolver justamente essa tensÃ£o com uma ideia simples:
- registrar tudo o que importa ao longo da sessÃ£o;
- compactar esse material para nÃ£o desperdiÃ§ar tokens;
- recuperar sÃ³ o que faz sentido na hora de continuar o trabalho.
Isso Ã© especialmente Ãºtil em tarefas longas, como manutenÃ§Ã£o de cÃ³digo, debugging em mÃºltiplas etapas, revisÃµes de arquitetura, investigaÃ§Ã£o de bugs histÃ³ricos e projetos que avanÃ§am em vÃ¡rias sessÃµes ao longo de dias ou semanas.

Como o Claude-Mem funciona por dentro

De acordo com a documentaÃ§Ã£o oficial, a arquitetura do projeto combina alguns blocos centrais:
- Hooks de ciclo de vida que observam o que acontece durante a sessÃ£o;
- Worker service local, com API HTTP e interface web em http://localhost:37777;
- Banco SQLite para armazenar sessÃµes, observaÃ§Ãµes e resumos;
- Busca hÃbrida, unindo indexaÃ§Ã£o textual e vetorial;
- MCP search tools para consultar a memÃ³ria de forma progressiva e econÃ´mica.
O ponto mais interessante Ã© o fluxo de consulta em trÃªs nÃveis:
1. Search â€” traz um Ãndice compacto com IDs e pistas rÃ¡pidas;
2. Timeline â€” mostra o contexto cronolÃ³gico ao redor de um ponto relevante;
3. Get observations â€” abre o detalhe completo apenas do que realmente importa.
Esse desenho evita o erro clÃ¡ssico de â€œcarregar tudo por via das dÃºvidasâ€. Em vez disso, o sistema comeÃ§a pequeno, filtra bem e sÃ³ aprofunda quando necessÃ¡rio.

Quais sÃ£o as funcionalidades mais fortes

1. MemÃ³ria persistente entre sessÃµes

O grande valor do Claude-Mem Ã© manter o histÃ³rico Ãºtil vivo mesmo depois que a sessÃ£o termina. Isso reduz repetiÃ§Ã£o, evita que o agente peÃ§a de novo as mesmas informaÃ§Ãµes e ajuda a manter coerÃªncia em projetos longos.

2. Progressive disclosure

Em vez de despejar todo o histÃ³rico no prompt, o Claude-Mem revela o contexto em camadas. Isso melhora a eficiÃªncia e mantÃ©m o uso de tokens sob controle.

3. Busca semÃ¢ntica e cronolÃ³gica

O projeto nÃ£o depende sÃ³ de palavras-chave. Ele tambÃ©m permite navegar por contexto temporal e por observaÃ§Ãµes detalhadas, o que facilita encontrar decisÃµes antigas, mudanÃ§as de rota e causas de bugs.

4. Interface web local

O worker service expÃµe uma UI web local, o que ajuda a inspecionar a memÃ³ria, acompanhar o que foi armazenado e entender como o contexto estÃ¡ sendo recuperado.

5. Privacidade e controle

O Claude-Mem inclui recursos para controlar o que entra na memÃ³ria, inclusive com tags <private> para excluir conteÃºdos sensÃveis do armazenamento.

6. Compatibilidade ampla

Embora a vitrine principal seja o Claude Code, o projeto tambÃ©m conversa com outras ferramentas e ecossistemas, como Gemini CLI, OpenCode, Cursor e integraÃ§Ãµes via MCP.

Por que ele economiza tantos tokens?

A resposta estÃ¡ no mÃ©todo. Em vez de resgatar o passado inteiro a cada nova consulta, o Claude-Mem usa um funil de recuperaÃ§Ã£o:
- primeiro encontra o que parece relevante;
- depois mostra o contexto ao redor;
- sÃ³ entÃ£o abre os detalhes.
Na documentaÃ§Ã£o, o projeto descreve esse modelo como uma forma de alcanÃ§ar ~10x de economia de tokens em comparaÃ§Ã£o com abordagens tradicionais de RAG que tentam carregar muito conteÃºdo logo de inÃcio. Em uso real, isso pode ser ainda mais valioso quando o agente lida com sessÃµes grandes, porque o ganho nÃ£o Ã© apenas financeiro: o modelo tambÃ©m tende a ficar mais rÃ¡pido, mais focado e menos confuso.

Em resumo: menos contexto irrelevante significa menos custo, menos ruÃdo e mais chance de o agente acertar a prÃ³xima aÃ§Ã£o.

Como instalar o Claude-Mem

A forma mais direta de instalar Ã© via npx:
```
npx claude-mem install
```
Se vocÃª usa o Gemini CLI, o instalador tambÃ©m detecta a pasta correta automaticamente:
```
npx claude-mem install --ide gemini-cli
```
Para o OpenCode:
```
npx claude-mem install --ide opencode
```
HÃ¡ tambÃ©m instalaÃ§Ã£o pela marketplace de plugins dentro do Claude Code:
```
/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem
```
Depois da instalaÃ§Ã£o, Ã© preciso reiniciar o Claude Code ou a CLI compatÃvel para que a memÃ³ria comece a aparecer automaticamente nas novas sessÃµes.

Requisitos e dependÃªncias
- Node.js 20+
- Claude Code com suporte a plugins
- Bun para o worker service
- uv para partes da busca vetorial
- SQLite 3 para persistÃªncia local
Ou seja: nÃ£o Ã© sÃ³ um â€œprompt hackâ€. Ã‰ uma camada de memÃ³ria de verdade, com persistÃªncia local e serviÃ§os auxiliares para consulta e recuperaÃ§Ã£o de contexto.

Como usar no dia a dia

Na prÃ¡tica, o uso Ã© quase invisÃvel. O sistema observa a sessÃ£o, registra o que aconteceu e vai alimentando a memÃ³ria. Quando vocÃª retoma um trabalho depois, ele tenta recuperar o que interessa sem vocÃª precisar refazer todo o briefing.

Para buscas mais especÃficas, a documentaÃ§Ã£o mostra exemplos como:
```
search(query="authentication bug", type="bugfix", limit=10)

timeline(anchor=<observation_id>, depth_before=3, depth_after=3)

get_observations(ids=[123, 456, 789])
```
Esse trio Ã© o coraÃ§Ã£o da experiÃªncia. Primeiro vocÃª encontra, depois contextualiza, por fim aprofunda.

Casos de uso em que ele brilha
- Debugging longo â€” quando um erro leva vÃ¡rias etapas para ser resolvido;
- RefatoraÃ§Ãµes grandes â€” quando decisÃµes antigas precisam ser lembradas com precisÃ£o;
- Code archaeology â€” para entender por que algo foi feito de determinada forma;
- Projetos multi-sessÃ£o â€” quando o trabalho se estende por dias ou semanas;
- Times e agentes mÃºltiplos â€” quando vÃ¡rios fluxos precisam acessar o mesmo histÃ³rico de forma eficiente.
LimitaÃ§Ãµes e cuidados

Apesar do nome chamativo, o Claude-Mem nÃ£o Ã© magia. Ele ajuda muito, mas ainda depende de alguns cuidados:
- nem tudo deve ir para a memÃ³ria â€” conteÃºdo sensÃvel precisa ser excluÃdo ou marcado como privado;
- o ganho real depende do fluxo â€” quanto mais vocÃª evita carregar contexto inÃºtil, maior o benefÃcio;
- instalaÃ§Ã£o e integraÃ§Ã£o exigem ambiente compatÃvel â€” Node, Bun, SQLite e a CLI certa;
- memÃ³ria nÃ£o substitui disciplina â€” uma boa organizaÃ§Ã£o de projeto ainda faz diferenÃ§a.
Vale a pena?

Se vocÃª usa Claude Code com frequÃªncia e trabalha em tarefas que ultrapassam uma sessÃ£o, a resposta curta Ã©: sim, vale muito a pena testar. O Claude-Mem ataca um problema real de produtividade para quem vive de contexto tÃ©cnico. Ele reduz repetiÃ§Ã£o, melhora continuidade, ajuda a recuperar decisÃµes antigas e pode cortar de forma expressiva o gasto com tokens.

O melhor cenÃ¡rio Ã© justamente aquele em que vocÃª alterna entre explorar, resolver, revisar e continuar. Nessa rotina, ter uma memÃ³ria persistente muda o jogo.

ConclusÃ£o

O Claude-Mem mostra que a prÃ³xima fronteira dos agentes de IA nÃ£o Ã© apenas â€œresponder melhorâ€, mas lembrar melhor. Em vez de depender de prompts cada vez maiores, ele organiza o conhecimento em camadas, recupera o que importa e mantÃ©m a continuidade entre sessÃµes. Para quem usa Claude Code como copiloto de desenvolvimento, isso pode representar um salto enorme em eficiÃªncia â€” inclusive na economia de tokens.

Se a promessa de atÃ© 95% de reduÃ§Ã£o soa exagerada Ã primeira vista, o ponto principal continua sendo vÃ¡lido: quanto mais inteligente for a recuperaÃ§Ã£o do contexto, menos vocÃª paga para repetir o que jÃ¡ foi aprendido.

Fonte: github.com/thedotmack/claude-mem
21 de junho de 2026
In the Weights: ex-OpenAI criam busca de vaidade que mede o quanto a IA te conhece

Dois ex-funcionÃ¡rios da OpenAI acabam de lanÃ§ar uma ferramenta que pode se tornar a nova obsessÃ£o do mundo tech: o In the Weights, um site que mede o quanto vocÃª Ã© “lembrado” pelos modelos de inteligÃªncia artificial.

Criado por Thomas Dimson e Joey Flynn â€” que chegaram Ã OpenAI quando a startup de design Global Illumination foi adquirida â€” o site consulta diversos modelos de IA (incluindo Grok, Gemini, mÃºltiplas versÃµes do GPT, Claude e Llama) com perguntas do tipo “Quem Ã© [nome]?” e atribui uma pontuaÃ§Ã£o de “forÃ§a” baseada nas respostas.

Como funciona

O In the Weights envia o nome da pessoa para cada modelo, coleta atÃ© 10 resultados com descriÃ§Ãµes curtas e nÃveis de confianÃ§a, e entÃ£o agrupa respostas similares para gerar uma pontuaÃ§Ã£o consolidada. O slogan do site nÃ£o economiza na ambiÃ§Ã£o:

“Estar nos pesos significa que sua existÃªncia foi considerada importante no processo de criaÃ§Ã£o de inteligÃªncia artificial sobre-humana.”

Resultados surpreendentes

Os criadores relataram que a recepÃ§Ã£o tem sido “insana”. Dimson contou ao TechCrunch que achava que seria uma “curiosidade moderada”, mas o site parece ter tocado em um nervo: “as pessoas querem saber se vÃ£o viver para sempre na superinteligÃªncia â€” e o fator comparaÃ§Ã£o tambÃ©m nÃ£o atrapalha.”

Um aspecto curioso: modelos diferentes da mesma famÃlia (como versÃµes distintas do GPT) retornam resultados diferentes para a mesma pessoa, revelando vieses e diferenÃ§as de treinamento. O GPT-5.4 Mini, por exemplo, classificou um nome como “forma ambÃgua que pode se referir a mÃºltiplas pessoas com as iniciais A.H.A.”

MotivaÃ§Ã£o

Dimson explicou que ele e Flynn queriam “reativar a criatividade” apÃ³s deixarem a OpenAI. A ideia surgiu da percepÃ§Ã£o de que buscas de vaidade no Google sÃ£o o objetivo errado em 2026, jÃ¡ que cada vez mais o trÃ¡fego migra para LLMs.

Os prÃ³ximos passos incluem investigar por que modelos da mesma sÃ©rie retornam resultados diferentes, quais modelos tÃªm viÃ©s para diferentes tipos de pessoas, e quem “deveria ter um artigo na WikipÃ©dia mas nÃ£o tem.”

Para os curiosos de plantÃ£o: o site estÃ¡ no ar e aceita consultas pÃºblicas. Qual serÃ¡ o seu score?

Fonte: TechCrunch (Anthony Ha)

20 de junho de 2026
The Atlantic expÃµe datasets com milhÃµes de mÃºsicas usadas para treinar IA

The Atlantic acaba de lanÃ§ar uma ferramenta que expÃµe uma realidade incÃ´moda para a indÃºstria da inteligÃªncia artificial: milhÃµes de mÃºsicas protegidas por direitos autorais estÃ£o disponÃveis gratuitamente em datasets usados para treinar modelos de IA generativa â€” e agora qualquer pessoa pode pesquisar quais artistas foram usados.

O repÃ³rter Alex Reisner, do The Atlantic, descobriu e tornou pÃºblicos quatro datasets de mÃºsica usados para treinar modelos de IA. Dois desses conjuntos sÃ£o gigantescos: um com 12 milhÃµes e outro com 9 milhÃµes de faixas. Os outros dois, menores mas ainda expressivos, contÃªm mais de 100 mil mÃºsicas cada.

Google e Stability AI jÃ¡ confirmaram o uso desses datasets em artigos de pesquisa. Embora alguns conjuntos, como o Free Music Archive, permitam streaming para uso pessoal, o licenciamento para aplicaÃ§Ãµes comerciais Ã© obrigatÃ³rio â€” e raramente respeitado.

Como os dados sÃ£o acessados

Reisner explica que trÃªs dos quatro datasets sÃ£o distribuÃdos como listas de links para mÃºsicas no YouTube e Spotify. Desenvolvedores de IA usam ferramentas automatizadas para baixar o Ã¡udio real â€” ferramentas que permitem burlar logins, anÃºncios e mecanismos de monetizaÃ§Ã£o dos criadores. Essas prÃ¡ticas violam os termos de serviÃ§o de ambas as plataformas.

De Lady Gaga a Radiohead

Os nomes que aparecem nos datasets vÃ£o de estrelas pop como Lady Gaga e Fred Again.., a Ãcones como Radiohead, Aphex Twin, Wu-Tang Clan e Bruce Springsteen, alÃ©m de artistas experimentais como Hainbach.

Os leitores podem acessar o site AI Watchdog do The Atlantic e pesquisar pessoalmente quais mÃºsicas, livros e outras mÃdias estÃ£o sendo usadas para treinar os modelos de IA ao redor do mundo.

Por que isso importa

Esta revelaÃ§Ã£o chega em um momento de crescente tensÃ£o entre criadores de conteÃºdo e empresas de IA. Com processos judiciais em andamento movidos por grandes gravadoras e associaÃ§Ãµes de direitos autorais, a transparÃªncia forÃ§ada por investigaÃ§Ãµes como a do The Atlantic pressiona ainda mais por regulaÃ§Ã£o e remuneraÃ§Ã£o justa.

A pergunta que fica: se os prÃ³prios datasets de treinamento se baseiam em conteÃºdo protegido obtido de forma questionÃ¡vel, qual o valor Ã©tico da mÃºsica gerada por IA?

Fonte: The Verge / The Atlantic (Alex Reisner)

20 de junho de 2026

Como Tornar Imagens de PDFs PesquisÃ¡veis para RAG Sem Gastar com Todas Elas

Este artigo de Kezhan Shi, publicado no Towards Data Science, apresenta uma abordagem inteligente para tornar imagens de PDFs pesquisÃ¡veis em sistemas RAG â€” sem gastar dinheiro lendo todas elas.

A sÃ©rie “Enterprise Document Intelligence” constrÃ³i um sistema RAG empresarial a partir de quatro blocos fundamentais. Neste quinto volume, o foco estÃ¡ em processar imagens de documentos de forma econÃ´mica, usando uma cascata ordenada por custo: um filtro barato, uma verificaÃ§Ã£o de tipo, OCR clÃ¡ssico e, por Ãºltimo, um modelo de visÃ£o.

O problema: nem toda imagem vale a pena

O reflexo natural seria jogar um modelo de visÃ£o em cada imagem do PDF e seguir em frente. Mas essa Ã© a abordagem errada. Um documento real estÃ¡ cheio de imagens que ninguÃ©m pesquisaria: o logotipo da empresa em cada pÃ¡gina, Ãcones minÃºsculos, linhas divisÃ³rias, marcas d’Ã¡gua. Processar tudo com modelos caros Ã© desperdÃcio de dinheiro e de latÃªncia.

A cascata de custo

A soluÃ§Ã£o proposta funciona em trÃªs etapas, da mais barata para a mais cara:

1. Filtro gratuito: eliminar o ruÃdo

Antes de qualquer chamada de modelo, um filtro analisa sinais jÃ¡ disponÃveis no dataframe de imagens e algumas estatÃsticas de pixel:

Tamanho mÃnimo: imagens com poucos pixels ou Ã¡rea muito pequena sÃ£o Ãcones ou bullets, nÃ£o figuras. Removidas.
ProporÃ§Ã£o suspeita: imagens muito longas e finas sÃ£o linhas ou divisores. Fora.
RepetiÃ§Ã£o entre pÃ¡ginas: o mesmo hash de conteÃºdo aparecendo na maioria das pÃ¡ginas Ã© “chrome” â€” logotipo, cabeÃ§alho, rodapÃ©. Descartado.

Em um relatÃ³rio tÃpico, sÃ³ essa etapa remove a grande maioria das imagens antes de qualquer modelo rodar. O que sobra sÃ£o as poucas que realmente carregam significado.

2. ClassificaÃ§Ã£o por tipo

As imagens que sobrevivem ao filtro nÃ£o sÃ£o todas lidas da mesma forma. Uma captura de tela de tabela Ã© texto â€” OCR clÃ¡ssico resolve. Um grÃ¡fico de linhas nÃ£o Ã© texto â€” seu significado estÃ¡ nos eixos e na forma visual.

A classificaÃ§Ã£o usa sinais baratos de pixel: variaÃ§Ã£o, saturaÃ§Ã£o, proporÃ§Ã£o de fundo branco, densidade de bordas:

Painel em branco: dispersÃ£o de pixel baixa â†’ pular (sem custo)
Imagem de texto: baixa saturaÃ§Ã£o, estrutura de traÃ§os, fundo branco â†’ OCR clÃ¡ssico (barato)
Imagem visual: saturada, sem margens brancas â†’ modelo de visÃ£o (caro)

O classificador Ã© deliberadamente conservador: na dÃºvida, manda para o modelo de visÃ£o. Um OCR perdido custa uma chamada de visÃ£o; um OCR executado em um diagrama retorna labels soltos e lixo.

3. AÃ§Ã£o por tipo

Tipo de imagem	AÃ§Ã£o	Custo
Muito pequena / formato estranho / repetida	Descartar	Zero
Painel em branco / uniforme	Pular	Zero
Imagem de texto (tabela, scan)	OCR clÃ¡ssico	Baixo
Imagem visual (grÃ¡fico, foto)	Modelo de visÃ£o	Alto

A escolha de design mais importante

O artigo destaca dois princÃpios fundamentais:

Logotipos sÃ£o pegos pelo filtro de repetiÃ§Ã£o, nÃ£o pelo classificador: um logotipo pode ter duas cores chapadas ou ser uma marca d’Ã¡gua colorida. Tentar detectar logo por aparÃªncia Ã© frÃ¡gil. Mas um logo Ã© “chrome” porque se repete em todas as pÃ¡ginas â€” e isso o filtro jÃ¡ captura.
O classificador nÃ£o tenta ser inteligente demais: classificar grÃ¡fico vs. diagrama vs. foto com sinais baratos nÃ£o Ã© confiÃ¡vel. EntÃ£o o classificador sÃ³ desvia imagens para OCR quando tem certeza absoluta de que Ã© texto. Todo o resto vai para o modelo de visÃ£o. O viÃ©s Ã© assimÃ©trico de propÃ³sito.

Por que isso importa

Para quem constrÃ³i sistemas RAG empresariais, este artigo oferece um roteiro prÃ¡tico para processar documentos PDF sem desperdÃcio. A lÃ³gica da cascata â€” comeÃ§ar pelo mÃ©todo mais barato e sÃ³ escalar quando necessÃ¡rio â€” Ã© um padrÃ£o que vale para muito alÃ©m de processamento de documentos.

O artigo completo, com implementaÃ§Ãµes em Python e exemplos de cÃ³digo, estÃ¡ disponÃvel no Towards Data Science.

20 de junho de 2026

Controles de ExportaÃ§Ã£o de IA: A HistÃ³ria Mostra Por Que Restringir o Mythos NÃ£o Vai Funcionar
Na semana passada, citando preocupaÃ§Ãµes nÃ£o especificadas de seguranÃ§a nacional, a Casa Branca ordenou que a Anthropic restringisse a exportaÃ§Ã£o de seus poderosos modelos de IA â€” Fable e Mythos â€” para qualquer pessoa fora dos Estados Unidos, incluindo estrangeiros dentro do paÃs. Pouco depois, a gigante de IA desligou abruptamente ambos os modelos, que estÃ£o indisponÃveis para qualquer pessoa hÃ¡ uma semana.

Este episÃ³dio Ã© o primeiro teste real sobre se o governo dos EUA pode usar controles de exportaÃ§Ã£o para conter a IA de fronteira da mesma forma que tentou â€” com resultados muito irregulares â€” conter a criptografia e o spyware antes dela. E, por mais dramÃ¡tico que pareÃ§a, o desfecho desse impasse pode moldar nÃ£o apenas o acesso da Anthropic a mercados estrangeiros, mas tambÃ©m o manual que outros laboratÃ³rios de IA terÃ£o que seguir.

O que desencadeou a proibiÃ§Ã£o?

Desde que a Anthropic lanÃ§ou o Mythos em abril, a empresa o comercializou como uma espÃ©cie de “mÃ¡quina cibernÃ©tica do apocalipse” que poderia causar estragos na internet se liberada amplamente. Por isso, antes da proibiÃ§Ã£o, apenas cerca de 150 empresas e organizaÃ§Ãµes governamentais tinham acesso ao modelo. O objetivo era ajudar defensores a proteger seus sistemas antes que agentes mal-intencionados alcanÃ§assem capacidades similares.

Dois eventos subsequentes teriam desencadeado a proibiÃ§Ã£o:
1. A Anthropic deu a uma operadora de telecom sul-coreana acesso ao Mythos atravÃ©s de seu programa limitado de parceiros, e autoridades americanas se alarmaram ao identificar a empresa como suspeita de ter laÃ§os com a China. (A empresa, amplamente reportada como SK Telecom, negou qualquer conexÃ£o com a China.)
2. O CEO da Amazon, Andy Jassy, tambÃ©m teria alertado o governo apÃ³s pesquisadores da Amazon encontrarem uma forma de contornar as salvaguardas do Fable 5. A Anthropic contesta o rÃ³tulo de “jailbreak”, chamando-o de um problema restrito e jÃ¡ corrigido, nÃ£o uma derrota completa das medidas de seguranÃ§a do modelo.
O resultado: o Departamento de ComÃ©rcio emitiu uma diretiva de controle de exportaÃ§Ã£o, e a Anthropic teve que restringir o acesso a seus produtos em cerca de 90 minutos apÃ³s ser notificada.

A histÃ³ria se repete

Nada disso Ã© novo. Governos vÃªm tentando usar controles de exportaÃ§Ã£o para limitar a proliferaÃ§Ã£o do que consideram tecnologia cibernÃ©tica perigosa hÃ¡ dÃ©cadas, com resultados no mÃ¡ximo medianos.

As “Guerras da Criptografia” (anos 90)

O governo dos EUA protagonizou talvez o fracasso mais espetacular dessa abordagem nos anos 90. Na Ã©poca, cientistas da computaÃ§Ã£o desenvolviam tecnologias de criptografia como o PGP (Pretty Good Privacy), que podia criptografar dados tornando-os virtualmente impossÃveis de decifrar.

O governo via o PGP como uma arma perigosa e abriu uma investigaÃ§Ã£o criminal contra seu criador, Phil Zimmermann, por suposta violaÃ§Ã£o de controles de exportaÃ§Ã£o de armas. Zimmermann contra-atacou publicando o cÃ³digo-fonte do PGP como um livro impresso, iniciando o que hoje se conhece como as “Guerras da Criptografia”. A investigaÃ§Ã£o foi encerrada, abrindo caminho para os algoritmos de criptografia usados hoje por bilhÃµes de pessoas no Signal e WhatsApp.

Spyware e o Acordo de Wassenaar (anos 2010)

No inÃcio dos anos 2010, pesquisadores descobriram spyware ocidental sendo usado contra dissidentes no Oriente MÃ©dio. Governos expandiram o Acordo de Wassenaar para classificar software de vigilÃ¢ncia como “dual-use”, forÃ§ando fabricantes de spyware a obter licenÃ§as de exportaÃ§Ã£o.

Mas o acordo sempre teve duas fraquezas inerentes: vÃ¡rios paÃses nÃ£o aderem a ele â€” incluindo Israel, que abriga alguns dos fabricantes de spyware mais ativos do mundo â€” e o acordo depende de cada paÃs aplicÃ¡-lo a empresas dentro de suas fronteiras conforme seu prÃ³prio critÃ©rio.

A ItÃ¡lia, por exemplo, permitiu que um dos principais fabricantes de spyware do paÃs continuasse vendendo para o exterior mesmo apÃ³s mÃºltiplos escÃ¢ndalos. E vÃ¡rios fabricantes simplesmente mudaram suas operaÃ§Ãµes para paÃses com controles de exportaÃ§Ã£o frouxos.

O que esperar do caso Mythos

No momento em que escrevo, o impasse entre a Anthropic e o governo Trump continua. HÃ¡ uma chance razoÃ¡vel de que o governo recue e suspenda a restriÃ§Ã£o no interesse de manter a competitividade dos EUA na corrida da IA â€” ou que aprove o acesso de parceiros confiÃ¡veis.

Mas, dadas as experiÃªncias passadas com tentativas de controlar o alcance de software, controles de exportaÃ§Ã£o mandatados pelo governo provavelmente nÃ£o sÃ£o a abordagem certa para impedir que atores mal-intencionados explorem a IA. A histÃ³ria mostra que o software sempre encontra um caminho.

E, talvez mais importante, a comunidade internacional ainda nÃ£o tem nenhuma estrutura viÃ¡vel para controles globais de exportaÃ§Ã£o de IA. AtÃ© que isso mude, assistiremos a mais episÃ³dios como este â€” com resultados igualmente incertos.
19 de junho de 2026

NVIDIA Apresenta SpatialClaw: Agente de IA Que Usa CÃ³digo Como Interface para RaciocÃnio Espacial

A NVIDIA Research acaba de lanÃ§ar o SpatialClaw, um framework “training-free” (sem necessidade de treinamento) para raciocÃnio espacial. O sistema ataca uma fraqueza persistente nos modelos de visÃ£o-linguagem (VLMs): a dificuldade em julgar onde objetos estÃ£o posicionados, como se relacionam e como se movem em 3D.

A grande sacada do SpatialClaw Ã© que ele nÃ£o retreina o modelo. Em vez disso, muda a interface de aÃ§Ã£o que o agente usa para invocar ferramentas de percepÃ§Ã£o. A equipe de pesquisa argumenta que a interface Ã© o gargalo, e a soluÃ§Ã£o Ã© tratar cÃ³digo como a interface de aÃ§Ã£o.

Os nÃºmeros impressionam: em 20 benchmarks, o SpatialClaw atinge 59,9% de precisÃ£o mÃ©dia, superando o agente espacial SpaceTools em 11,2 pontos percentuais.

O que Ã© o SpatialClaw

O SpatialClaw Ã© um loop de agente envolvendo um kernel Python com estado. O kernel Ã© prÃ©-carregado com frames de entrada e um conjunto de primitivas. As ferramentas de percepÃ§Ã£o sÃ£o funÃ§Ãµes Python comuns â€” suas saÃdas (mÃ¡scaras, mapas de profundidade, geometria de cÃ¢mera e trajetÃ³rias) sÃ£o variÃ¡veis Python normais.

O kernel expÃµe seis pontos de entrada pÃºblicos:

InputImages: armazena os frames amostrados
tools: expÃµe primitivas de percepÃ§Ã£o e geometria
show(): incorpora uma imagem no prÃ³ximo contexto do agente
vlm: despacha consultas para uma sessÃ£o VLM separada
ReturnAnswer(): submete a resposta final

Duas ferramentas de percepÃ§Ã£o sÃ£o centrais. A tools.Reconstruct utiliza Depth Anything 3 e retorna profundidade por frame, intrÃnsecos e extrÃnsecos da cÃ¢mera, e mapas de pontos densos. A tools.SAM3 utiliza SAM 3 e produz mÃ¡scaras de imagem ou vÃdeo a partir de prompts de texto, ponto ou caixa delimitadora.

O framework Ã© totalmente training-free â€” o mesmo prompt de sistema, conjunto de ferramentas e hiperparÃ¢metros funcionam em todos os benchmarks e backbones.

Por que a Interface de AÃ§Ã£o Importa

A equipe estudou trÃªs interfaces de aÃ§Ã£o na mesma pergunta: medir a distÃ¢ncia mais prÃ³xima entre um aquecedor e uma porta.

Single-pass code: escreve um programa completo e executa uma vez. Assume uma estratÃ©gia antes de ver qualquer mÃ¡scara ou mapa de profundidade. Um erro de suposiÃ§Ã£o se propaga direto para a resposta.
Structured tool-call: invoca ferramentas nomeadas via schema JSON fixo. NÃ£o consegue combinar livremente outputs com NumPy ou SciPy para cÃ¡lculos em tempo de teste. O resultado Ã© incorreto.
SpatialClaw: compÃµe ferramentas em cÃ³digo, inspeciona resultados, e entÃ£o revisa. Primeiro calcula uma distÃ¢ncia de centroide, depois percebe que o centroide usa mediana. O agente troca para scipy.spatial.KDTree e encontra o ponto mais prÃ³ximo real: 0,9439 m contra um ground truth de 0,9 m.

Benchmark e Resultados

O SpatialClaw foi testado em 20 benchmarks distribuÃdos em cinco categorias: single-image, multi-view, general, video/4D, e compreensÃ£o geral de vÃdeo. Ele melhora sobre o baseline sem ferramentas em todos os seis backbones testados â€” variando de 26B a 397B parÃ¢metros nas famÃlias Qwen3.5/3.6 e Gemma4.

ComparaÃ§Ã£o controlada isolando a interface (backbone Gemma4-31B):

Interface de AÃ§Ã£o	MÃ©dia (20 bench.)	Î” vs no-tool
No-tool baseline	53,4	â€”
Single-pass code	55,2	+1,8
Structured tool-call	56,7	+3,3
SpatialClaw (code as action)	59,9	+6,5

Os ganhos mais expressivos estÃ£o em tarefas dinÃ¢micas. No Gemma4-31B, o DSI-Bench subiu +17,6 pontos e o MindCube subiu +15,3 pontos â€” categorias que exigem computaÃ§Ã£o geomÃ©trica encadeada entre frames e pontos de vista.

Por que Isso Importa

O SpatialClaw mostra que a interface de aÃ§Ã£o Ã© tÃ£o importante quanto o modelo em si. Ao tratar cÃ³digo como a linguagem de aÃ§Ã£o do agente, a NVIDIA conseguiu ganhos substanciais sem nenhum fine-tuning. Isso abre caminho para agentes de IA mais capazes em tarefas que exigem raciocÃnio espacial â€” de robÃ³tica a navegaÃ§Ã£o autÃ´noma e AR/VR.

O cÃ³digo e o paper estÃ£o disponÃveis no site oficial do projeto.

19 de junho de 2026

Governo dos EUA proÃbe Anthropic de liberar Fable 5 e Mythos 5: aliados reagem e Europa pede soberania em IA

O governo dos Estados Unidos emitiu uma ordem sem precedentes na indÃºstria de inteligÃªncia artificial: proibiu a Anthropic de disponibilizar seus dois modelos mais avanÃ§ados â€” Fable 5 e Mythos 5 â€” para qualquer pessoa fora do paÃs, incluindo aliados histÃ³ricos. A decisÃ£o provocou uma crise diplomÃ¡tica, reacendeu o debate sobre soberania tecnolÃ³gica e colocou em xeque o futuro do acesso global Ã IA de ponta.

O que aconteceu

Na Ãºltima semana, o governo Trump emitiu uma ordem de controle de exportaÃ§Ã£o que forÃ§ou a Anthropic a retirar completamente do ar os modelos Fable 5 e Mythos 5 para garantir conformidade. A empresa jÃ¡ havia concedido acesso ao Claude Mythos Preview para 200 instituiÃ§Ãµes em 15 paÃses para testes de vulnerabilidade, e as versÃµes pÃºblicas estavam programadas para lanÃ§amento no inÃcio de junho.

A Anthropic afirmou que o governo dos EUA nÃ£o forneceu uma razÃ£o oficial para a ordem, mas que seu entendimento Ã© de que a administraÃ§Ã£o Trump acreditava ter descoberto um mÃ©todo de “jailbreaking” do Fable 5 â€” uma tÃ©cnica para contornar as salvaguardas de seguranÃ§a do modelo.

“Corrija este cÃ³digo”: as trÃªs palavras que acionaram o alarme

Segundo a Fortune, tudo comeÃ§ou com trÃªs palavras: “Fix this code” (Corrija este cÃ³digo). Um prompt aparentemente inofensivo teria demonstrado uma capacidade do Fable 5 que alarmou as agÃªncias de seguranÃ§a nacional dos EUA, levando Ã ordem de bloqueio em questÃ£o de dias.

O caso levantou questÃµes sobre o equilÃbrio entre seguranÃ§a nacional e inovaÃ§Ã£o: o Fable 5 foi bloqueado, mas o GPT-5.5 da OpenAI â€” um modelo de capacidade comparÃ¡vel â€” nÃ£o sofreu a mesma restriÃ§Ã£o, como apontou o Mashable.

Terremoto na Europa: Macron chama decisÃ£o de “nacionalista”

A proibiÃ§Ã£o enviou ondas de choque imediatas pela Europa, que Ã© fortemente dependente de IA desenvolvida nos EUA. O presidente francÃªs Emmanuel Macron classificou a ordem como um “alerta” sobre os perigos da IA, mas criticou duramente a abordagem:

“A reaÃ§Ã£o Ã©, em alguns aspectos, estritamente nacionalista. Os limites sÃ£o uma coisa ruim.”

Macron falou durante a reuniÃ£o do G7 esta semana, alertando contra o perigo da “nÃ£o cooperaÃ§Ã£o entre democracias”. O porta-voz da ComissÃ£o Europeia para soberania tecnolÃ³gica, Thomas Regnier, reforÃ§ou que abordar questÃµes de seguranÃ§a em IA Ã© um “desafio compartilhado, nÃ£o confinado a uma Ãºnica jurisdiÃ§Ã£o ou paÃs”.

“Uma naÃ§Ã£o que depende de outros para sua tecnologia pode ser desconectada da noite para o dia”

O impacto mais profundo da decisÃ£o americana foi acelerar os apelos por autossuficiÃªncia tecnolÃ³gica entre os aliados dos EUA. O primeiro-ministro canadense Mark Carney declarou:

“A situaÃ§Ã£o em que estamos coletivamente agora com Mythos e Fable Ã© algo que pode acontecer com dependÃªncia excessiva. NinguÃ©m fez nada de errado nesta situaÃ§Ã£o. Mas teremos feito algo errado se simplesmente aceitarmos isso, nÃ£o aprendermos a liÃ§Ã£o e nÃ£o diversificarmos.”

O ex-ministro francÃªs Bruno Retailleau, candidato Ã presidÃªncia em 2027, foi ainda mais direto:

“Uma naÃ§Ã£o que depende de outros para sua tecnologia Ã© uma naÃ§Ã£o que pode ser desconectada da noite para o dia. Devemos tratar a IA como tratamos a energia nuclear: devemos pensar nela como parte de nossa soberania. DominÃ¡-la ou sofrÃª-la: nÃ£o hÃ¡ outro caminho.”

O “efeito Streisand” da proibiÃ§Ã£o

Ironicamente, o banimento pode estar ajudando a marca da Anthropic. A cobertura massiva da mÃdia global â€” da Al Jazeera Ã Forbes, do Time Ã NBC News â€” transformou o Fable 5 no modelo de IA mais comentado do momento.

Enquanto isso, modelos open-source correram para preencher a lacuna: segundo o The New Stack, quatro modelos abertos diferentes responderam Ã demanda antes mesmo que a Anthropic pudesse restaurar o acesso. A empresa tambÃ©m lanÃ§ou uma nova polÃtica de privacidade oferecendo uma alternativa para consumidores americanos contornarem as restriÃ§Ãµes, conforme reportou a CIO.com.

O que estÃ¡ em jogo

Para os investidores, a proibiÃ§Ã£o chega em um momento crÃtico: a Anthropic se prepara para um IPO e a decisÃ£o do governo americano adiciona uma camada de incerteza regulatÃ³ria sem precedentes. Para os desenvolvedores que construÃam sobre a plataforma, o bloqueio repentino foi um lembrete brutal dos riscos de depender de um Ãºnico fornecedor de IA.

Para o mundo, o caso Fable 5 Ã© um marco: a primeira vez que um governo ocidental bloqueia o acesso a um modelo de IA de ponta por razÃµes de seguranÃ§a nacional â€” e um sinal claro de que a geopolÃtica da inteligÃªncia artificial entrou em uma nova fase.

O que vocÃª acha? A decisÃ£o do governo americano foi acertada ou exagerada? A Europa deveria acelerar seus prÃ³prios modelos de IA? Deixe sua opiniÃ£o nos comentÃ¡rios.

19 de junho de 2026
BilionÃ¡rio Ambani Quer IA em Cada Chamada, App e Casa

Enquanto a Ãndia busca um competidor local na corrida global da inteligÃªncia artificial, o bilionÃ¡rio Mukesh Ambani estÃ¡ posicionando a Reliance Industries como campeÃ£ nacional, lanÃ§ando serviÃ§os de IA para chamadas telefÃ´nicas, aplicativos mÃ³veis e casas conectadas.

Na reuniÃ£o anual de acionistas na sexta-feira, o conglomerado sediado em Mumbai anunciou o Jio Call Agent, um assistente de IA que pode participar de chamadas telefÃ´nicas para transcrever conversas, gerar resumos e realizar tarefas como reservar transporte, pedir comida e fazer reservas. O serviÃ§o, que pode ser ativado dizendo “Hey Jio”, deve ser lanÃ§ado ainda este ano para os mais de 500 milhÃµes de usuÃ¡rios da Jio.

Ao integrar o serviÃ§o diretamente na sua rede de telecomunicaÃ§Ãµes em vez de oferecÃª-lo como um aplicativo independente, a Jio aposta que a assistÃªncia de IA pode se tornar um recurso nativo das chamadas telefÃ´nicas. A abordagem pode reduzir a dependÃªncia dos consumidores de aplicativos de terceiros e dar Ã Reliance uma vantagem de distribuiÃ§Ã£o poderosa em um mercado de IA cada vez mais concorrido.

Um ecossistema completo de IA

A Reliance tambÃ©m revelou uma versÃ£o com IA do seu aplicativo MyJio, capaz de realizar tarefas em nome dos usuÃ¡rios â€” desde ativar eSIMs atÃ© selecionar planos de roaming â€” por meio de comandos em linguagem natural. A empresa tambÃ©m apresentou o TeleFrame, um display domÃ©stico que usa agentes de IA para exibir proativamente informaÃ§Ãµes e recomendaÃ§Ãµes, como alertas meteorolÃ³gicos, agendas e lembretes domÃ©sticos.

Os anÃºncios marcam a prÃ³xima fase das ambiÃ§Ãµes de IA da Reliance, enquanto a Ãndia busca construir capacidades domÃ©sticas em um campo amplamente dominado por empresas dos Estados Unidos e da China. O movimento segue o lanÃ§amento da Reliance Intelligence no ano passado, por meio da qual o conglomerado pretende desenvolver infraestrutura e serviÃ§os de IA para consumidores, empresas e governos, incluindo aplicaÃ§Ãµes que suportam 22 idiomas indianos.

“A Ãndia nÃ£o deve ser uma mera consumidora de IA criada em outros lugares. Deve se tornar criadora, adotante e lÃder global em IA”, disse Ambani, de 69 anos.

Investimentos massivos e parcerias estratÃ©gicas

A Reliance vem acelerando suas ambiÃ§Ãµes de IA por meio de parcerias com Google, Meta e Nvidia. No inÃcio deste ano, a empresa anunciou planos de investir US$ 110 bilhÃµes em infraestrutura de IA, enquanto busca se estabelecer como uma grande player no emergente ecossistema de IA da Ãndia.

Na reuniÃ£o de acionistas, a Reliance tambÃ©m revelou um conjunto de serviÃ§os de IA para saÃºde, educaÃ§Ã£o, agricultura e pequenas empresas. Os produtos, batizados de JioHealthIQ, JioLearnIQ, JioKrishiIQ e AI Vyapar, sÃ£o projetados para operar em vÃ¡rios idiomas indianos e atender Ã s necessidades locais.

O encontro tambÃ©m trouxe uma grande novidade para investidores que aguardam a estreia da Jio na bolsa de valores. Ambani disse que o conselho da Jio Platforms aprovou um prospecto preliminar para uma oferta pÃºblica inicial (IPO) que incluiria uma emissÃ£o de atÃ© 270 milhÃµes de aÃ§Ãµes.

Fonte: TechCrunch

19 de junho de 2026
Subquadratic afirma ter resolvido o gargalo matemÃ¡tico dos transformers â€” e tem benchmarks independentes para provar

A startup de Miami Subquadratic saiu do stealth com uma afirmaÃ§Ã£o ousada: resolveu um gargalo matemÃ¡tico que limita os modelos de linguagem hÃ¡ quase uma dÃ©cada. Um mÃªs depois, a empresa comeÃ§ou a mostrar as provas.

O problema Ã© a atenÃ§Ã£o densa (dense attention), o mecanismo central dos transformers. Quando um LLM processa texto, cada token precisa ser multiplicado por todos os outros tokens. Isso gera uma expansÃ£o quadrÃ¡tica de computaÃ§Ãµes â€” dobre o texto e vocÃª quadruplica os cÃ¡lculos. Ã‰ por isso que rodar modelos como GPT-4 e Claude custa caro, consome energia absurda e fica lento com contextos longos.

A Subquadratic diz ter resolvido isso com atenÃ§Ã£o esparsa dinÃ¢mica (sparse attention). Em vez de multiplicar cada token por todos os outros, o modelo seleciona dinamicamente apenas as relaÃ§Ãµes importantes. “AtenÃ§Ã£o esparsa diz que nem todas essas relaÃ§Ãµes sÃ£o importantes, porque elas nÃ£o sÃ£o”, explica Alex Whedon, CTO e cofundador. “Se vocÃª estÃ¡ lendo um livro, nÃ£o vai comparar a primeira com a segunda palavra, primeira com a terceira â€” isso Ã© insano.”

O resultado Ã© o SubQ, um LLM que segundo a empresa Ã© atÃ© 56 vezes mais rÃ¡pido que modelos usando FlashAttention, processa 12 vezes mais texto de uma vez e consome muito menos energia â€” tudo isso igualando o desempenho dos melhores modelos de OpenAI, Google DeepMind e Anthropic em tarefas como cÃ³digo.

A comunidade recebeu com ceticismo. Dan McAteer, engenheiro de IA, resumiu o clima no X: “SubQ Ã© o maior avanÃ§o desde o Transformer… ou Ã© a Theranos da IA.”

Mas a Subquadratic contratou a Appen, empresa independente que avalia modelos, para rodar seus testes. Os resultados parecem validar as afirmaÃ§Ãµes. “Fiquei tipo ‘uau, isso pode mudar o jogo’”, disse Jeanine Sinanan-Singh, diretora de pesquisa em IA generativa da Appen. “Modelos sofrem com velocidade e ineficiÃªncia.”

O SubQ nÃ£o substitui os modelos atuais em todas as tarefas, mas pode oferecer ganhos enormes de velocidade por uma fraÃ§Ã£o do custo para tarefas especÃficas â€” como analisar centenas de documentos ou bases de cÃ³digo inteiras.

O CEO Justin Dangel Ã© ambicioso: “Esperamos estar iniciando uma nova era de eficiÃªncia. Achamos que ninguÃ©m vai continuar construindo sobre transformers densos.”

A startup ainda nÃ£o liberou o SubQ para testes pÃºblicos, mas prometeu divulgar benchmarks verificados antes de qualquer anÃºncio futuro. O artigo completo da MIT Technology Review tem todos os detalhes tÃ©cnicos: A startup claims it broke through a bottleneck that’s holding back LLMs.

19 de junho de 2026
Subquadratic afirma ter resolvido o gargalo que limita os LLMs â€” e os testes independentes mostram velocidade 56x maior

A startup americana Subquadratic saiu do modo stealth no mÃªs passado com uma afirmaÃ§Ã£o ambiciosa: resolveram o gargalo matemÃ¡tico que tem limitado os grandes modelos de linguagem (LLMs) hÃ¡ quase uma dÃ©cada. Agora, a empresa sediada em Miami comeÃ§a a apresentar evidÃªncias independentes que tornam suas alegaÃ§Ãµes muito mais difÃceis de ignorar.

O problema da atenÃ§Ã£o quadrÃ¡tica

Para entender por que as alegaÃ§Ãµes da Subquadratic sÃ£o tÃ£o impactantes, Ã© preciso mergulhar em como os LLMs funcionam. O mecanismo central de um LLM Ã© um tipo de rede neural chamada transformer, que executa um processo conhecido como atenÃ§Ã£o densa (“dense attention”). Quando um transformer processa um texto, ele codifica cada palavra (ou token) com um nÃºmero e depois multiplica cada nÃºmero por todos os outros nÃºmeros daquele texto. Um texto de 10.000 palavras dispara quase 50 milhÃµes de multiplicaÃ§Ãµes individuais.

Conforme o texto aumenta, o nÃºmero de cÃ¡lculos dispara de forma quadrÃ¡tica â€” dobre o nÃºmero de palavras e vocÃª quadruplica os cÃ¡lculos. Ã‰ por isso que os LLMs sÃ£o notÃ³rios devoradores de energia e dinheiro.

SubQ: atenÃ§Ã£o esparsa e velocidade 56x maior

A soluÃ§Ã£o da Subquadratic Ã© abandonar a atenÃ§Ã£o densa em favor da atenÃ§Ã£o esparsa (“sparse attention”), que reduz drasticamente os cÃ¡lculos. Em vez de multiplicar cada token por todos os outros, o modelo seleciona dinamicamente quais pares de tokens sÃ£o relevantes para o contexto especÃfico.

“Se vocÃª estÃ¡ lendo um livro, vocÃª nÃ£o vai comparar a primeira e a segunda palavra, primeira e terceira â€” isso Ã© insano”, explica Alex Whedon, CTO e cofundador da Subquadratic.

O modelo se chama SubQ e, segundo testes independentes conduzidos pela empresa Appen, Ã© 56 vezes mais rÃ¡pido que modelos que usam FlashAttention (a tÃ©cnica anterior de atenÃ§Ã£o esparsa). Em benchmarks de cÃ³digo como o LiveCodeBench, o SubQ atingiu 89,7% de precisÃ£o â€” competitivo com os melhores modelos de codificaÃ§Ã£o do mercado.

Custo e capacidade de contexto sem precedentes

O SubQ possui uma janela de contexto de atÃ© 12 milhÃµes de tokens â€” 12 vezes maior que a maioria dos modelos atuais, limitados a cerca de 1 milhÃ£o. Em uma demonstraÃ§Ã£o, o SubQ processou e raciocinou sobre 400 documentos simultÃ¢neos em segundos. Quando o Perplexity recebeu a mesma tarefa, sequer conseguiu carregar todos os documentos.

Em termos de custo, a diferenÃ§a Ã© ainda mais gritante: executar o Opus 4.6 da Anthropic no teste RULER 128 custa cerca de US$ 2.600. O SubQ? Oito dÃ³lares.

Nos testes de “needle-in-a-haystack”, o SubQ obteve 98% de precisÃ£o com janelas de contexto de 6 e 12 milhÃµes de tokens â€” praticamente perfeito em escalas que poucos modelos sequer testam.

Ceticismo justificado

Apesar dos nÃºmeros impressionantes, o ceticismo Ã© compreensÃvel. A Subquadratic Ã© uma empresa pequena com recursos limitados, e o modelo ainda nÃ£o estÃ¡ amplamente disponÃvel para testes pÃºblicos. Dezenas de milhares jÃ¡ se inscreveram na lista de espera, incluindo mais de 500 clientes empresariais, mas poucos tiveram acesso atÃ© agora.

Outro ponto levantado por pesquisadores: a Subquadratic reutilizou pesos de um modelo open-source chinÃªs (Qwen) para inicializar o SubQ, em vez de treinar do zero. Embora seja uma prÃ¡tica comum na indÃºstria, isso enfraquece a alegaÃ§Ã£o de terem reinventado completamente o funcionamento dos LLMs.

“A evidÃªncia pÃºblica ainda nÃ£o justifica a alegaÃ§Ã£o mais forte de que eles resolveram o gargalo da atenÃ§Ã£o quadrÃ¡tica”, pondera Will Depue, pesquisador independente que trabalhou anteriormente na OpenAI.

Uma nova era de eficiÃªncia?

A Subquadratic insiste que a reinvenÃ§Ã£o Ã© o Ãºnico caminho para startups competirem com gigantes. “Esperamos estar iniciando uma nova era de eficiÃªncia”, diz Justin Dangel, CEO e cofundador. “Achamos que ninguÃ©m estarÃ¡ construindo em cima de transformers daqui a alguns anos.”

Se o SubQ cumprir o que promete, a equaÃ§Ã£o da IA generativa pode mudar radicalmente â€” mais rÃ¡pida, mais barata e capaz de processar volumes de dados antes impensÃ¡veis. O copo estÃ¡ meio cheio de evidÃªncias, mas o gole final ainda depende de acesso pÃºblico e testes independentes em larga escala.

19 de junho de 2026
Elastic adquire startup de IA DeductiveAI por atÃ© US$ 85 milhÃµes

A Elastic, empresa conhecida pelo Elasticsearch, concordou em adquirir a startup de IA DeductiveAI por atÃ© US$ 85 milhÃµes, segundo uma fonte com conhecimento direto do acordo.

Fundada em 2023, a DeductiveAI saiu do stealth em novembro do ano passado, quando anunciou uma rodada seed de US$ 7,5 milhÃµes liderada pela CRV, com participaÃ§Ã£o da Databricks Ventures, Thomvest Ventures e PrimeSet. O investimento avaliou a startup em US$ 33 milhÃµes, de acordo com o PitchBook.

A aquisiÃ§Ã£o marca uma saÃda rÃ¡pida para a DeductiveAI, que opera em um setor de rÃ¡pido crescimento conhecido como AI SRE (Site Reliability Engineering com IA). Ferramentas de SRE com IA se tornaram essenciais diante do enorme volume de cÃ³digo gerado por inteligÃªncia artificial. Substituir a depuraÃ§Ã£o manual por IA permite que engenheiros de SRE se concentrem mais em desenvolvimento de produto do que em apagar incÃªndios constantemente.

TendÃªncia de aquisiÃ§Ãµes de startups de IA

A aquisiÃ§Ã£o reflete uma tendÃªncia mais ampla: grandes empresas de tecnologia estabelecidas estÃ£o comprando startups nativas de IA para integrar tecnologias baseadas em agentes em suas suÃtes de produtos existentes.

A Elastic, que abriu capital em 2018, Ã© mais conhecida pelo Elasticsearch, o mecanismo de busca e anÃ¡lise que ajuda organizaÃ§Ãµes a armazenar, pesquisar, analisar e monitorar grandes volumes de dados em tempo quase real. Seu software de observabilidade pode se beneficiar significativamente da tecnologia da DeductiveAI.

Segundo a fonte, integrar a tecnologia de IA da DeductiveAI Ã Elastic permitirÃ¡ que os clientes monitorem automaticamente o desempenho e resolvam falhas de sistema em tempo real.

CompetiÃ§Ã£o no setor

A DeductiveAI foi cofundada por Rakesh Kothari, anteriormente VP de engenharia da ThoughtSpot, e Sameer Agarwal, ex-Apache Software Foundation e Meta, que tambÃ©m foi um dos engenheiros fundadores da Databricks.

Embora a DeductiveAI tenha alcanÃ§ado aproximadamente US$ 1 milhÃ£o em receita recorrente anual (ARR), seu crescimento ficou atrÃ¡s da Resolve AI, uma das lÃderes do setor. A Resolve, fundada hÃ¡ dois anos pelo ex-executivo da Splunk Spiros Xanthos, foi avaliada em US$ 1,5 bilhÃ£o em abril, quando levantou uma extensÃ£o de SÃ©rie A de US$ 40 milhÃµes.

O acordo demonstra o apetite contÃnuo do mercado por soluÃ§Ãµes de IA aplicadas a operaÃ§Ãµes de TI e confiabilidade de sistemas â€” um nicho que deve crescer Ã medida que mais cÃ³digo gerado por IA chega Ã produÃ§Ã£o.

19 de junho de 2026
Baseten levanta US$ 1,5 bilhÃ£o e valuation salta para US$ 13 bilhÃµes em apenas 5 meses

Baseten levanta US$ 1,5 bilhÃ£o e valuation salta para US$ 13 bilhÃµes em apenas 5 meses

A startup de inferÃªncia de IA Baseten estÃ¡ prestes a fechar uma rodada de financiamento impressionante de US$ 1,5 bilhÃ£o, avaliando a empresa em US$ 13 bilhÃµes, segundo informaÃ§Ãµes do Wall Street Journal.

O que torna esse nÃºmero ainda mais surpreendente Ã© o intervalo entre as rodadas. HÃ¡ apenas cinco meses, em janeiro de 2026, a Baseten anunciou uma SÃ©rie E de US$ 300 milhÃµes com valuation de US$ 5 bilhÃµes. E essa rodada veio apenas nove meses depois de uma SÃ©rie D de US$ 150 milhÃµes.

Se confirmada, esta nova rodada representa um aumento de 160% no valuation em menos de seis meses â€” um ritmo quase sem precedentes mesmo no frenÃ©tico mercado de IA.

Split-priced round: valuation turbinado artificialmente?

O WSJ revela que a rodada utiliza uma estrutura de split-priced round, tÃ¡tica que startups estÃ£o adotando para inflar o valuation principal e fazer os investidores-lÃderes parecerem mais bem-sucedidos no papel. Alguns investidores entram com valuation de US$ 13 bilhÃµes, enquanto outros aportam com valuation de US$ 11 bilhÃµes.

A rodada Ã© co-liderada por Spark Capital, Sands Capital, Altimeter Capital e Wellington Management.

A corrida do ouro da inferÃªncia

A Baseten compete no mercado de inferÃªncia de IA como serviÃ§o â€” permitindo que empresas executem modelos de linguagem de grande escala (LLMs) em produÃ§Ã£o sem gerenciar infraestrutura prÃ³pria. Com a explosÃ£o de agentes de IA, RAG (geraÃ§Ã£o aumentada por recuperaÃ§Ã£o) e aplicaÃ§Ãµes que exigem latÃªncia baixÃssima, a demanda por plataformas de inferÃªncia dedicadas disparou.

Concorrentes como Together AI, Fireworks AI e Groq tambÃ©m captaram centenas de milhÃµes nos Ãºltimos meses, confirmando que Wall Street e o venture capital enxergam a inferÃªncia como a prÃ³xima grande frente de infraestrutura de IA â€” depois da corrida pelos chips e data centers.

O frenesi de investimentos levanta questÃµes sobre sustentabilidade. Com valuations dobrando a cada semestre, a pressÃ£o por receita proporcional serÃ¡ enorme quando essas startups eventualmente abrirem capital ou enfrentarem um mercado menos generoso.

Fonte: TechCrunch e Wall Street Journal

18 de junho de 2026

Tag: IA

Claude-Mem: a â€œmemÃ³ria infinitaâ€ que faz o Claude Code lembrar do que jÃ¡ fez

O problema que ele resolve

Como o Claude-Mem funciona por dentro

Quais sÃ£o as funcionalidades mais fortes

1. MemÃ³ria persistente entre sessÃµes

2. Progressive disclosure

3. Busca semÃ¢ntica e cronolÃ³gica

4. Interface web local

5. Privacidade e controle

6. Compatibilidade ampla

Por que ele economiza tantos tokens?

Como instalar o Claude-Mem

Requisitos e dependÃªncias

Como usar no dia a dia

Casos de uso em que ele brilha

LimitaÃ§Ãµes e cuidados

Vale a pena?

ConclusÃ£o

Como funciona

Resultados surpreendentes

MotivaÃ§Ã£o

Como os dados sÃ£o acessados

De Lady Gaga a Radiohead

Por que isso importa

O problema: nem toda imagem vale a pena

A cascata de custo

1. Filtro gratuito: eliminar o ruÃ­do

2. ClassificaÃ§Ã£o por tipo

3. AÃ§Ã£o por tipo

A escolha de design mais importante

Por que isso importa

O que desencadeou a proibiÃ§Ã£o?

A histÃ³ria se repete

As “Guerras da Criptografia” (anos 90)

Spyware e o Acordo de Wassenaar (anos 2010)

O que esperar do caso Mythos

O que Ã© o SpatialClaw

Por que a Interface de AÃ§Ã£o Importa

Benchmark e Resultados

Por que Isso Importa

O que aconteceu

“Corrija este cÃ³digo”: as trÃªs palavras que acionaram o alarme

Terremoto na Europa: Macron chama decisÃ£o de “nacionalista”

“Uma naÃ§Ã£o que depende de outros para sua tecnologia pode ser desconectada da noite para o dia”

O “efeito Streisand” da proibiÃ§Ã£o

O que estÃ¡ em jogo

Um ecossistema completo de IA

Investimentos massivos e parcerias estratÃ©gicas

O problema da atenÃ§Ã£o quadrÃ¡tica

SubQ: atenÃ§Ã£o esparsa e velocidade 56x maior

Custo e capacidade de contexto sem precedentes

Ceticismo justificado

Uma nova era de eficiÃªncia?

TendÃªncia de aquisiÃ§Ãµes de startups de IA

CompetiÃ§Ã£o no setor

Baseten levanta US$ 1,5 bilhÃ£o e valuation salta para US$ 13 bilhÃµes em apenas 5 meses

Split-priced round: valuation turbinado artificialmente?

A corrida do ouro da inferÃªncia

Claude-Mem: a â€œmemÃ³ria infinitaâ€ que faz o Claude Code lembrar do que jÃ¡ fez

1. Filtro gratuito: eliminar o ruÃdo