Blog

NVIDIA Apresenta SpatialClaw: Agente de IA Que Usa CÃ³digo Como Interface para RaciocÃnio Espacial

A NVIDIA Research acaba de lanÃ§ar o SpatialClaw, um framework “training-free” (sem necessidade de treinamento) para raciocÃnio espacial. O sistema ataca uma fraqueza persistente nos modelos de visÃ£o-linguagem (VLMs): a dificuldade em julgar onde objetos estÃ£o posicionados, como se relacionam e como se movem em 3D.

A grande sacada do SpatialClaw Ã© que ele nÃ£o retreina o modelo. Em vez disso, muda a interface de aÃ§Ã£o que o agente usa para invocar ferramentas de percepÃ§Ã£o. A equipe de pesquisa argumenta que a interface Ã© o gargalo, e a soluÃ§Ã£o Ã© tratar cÃ³digo como a interface de aÃ§Ã£o.

Os nÃºmeros impressionam: em 20 benchmarks, o SpatialClaw atinge 59,9% de precisÃ£o mÃ©dia, superando o agente espacial SpaceTools em 11,2 pontos percentuais.

O que Ã© o SpatialClaw

O SpatialClaw Ã© um loop de agente envolvendo um kernel Python com estado. O kernel Ã© prÃ©-carregado com frames de entrada e um conjunto de primitivas. As ferramentas de percepÃ§Ã£o sÃ£o funÃ§Ãµes Python comuns â€” suas saÃdas (mÃ¡scaras, mapas de profundidade, geometria de cÃ¢mera e trajetÃ³rias) sÃ£o variÃ¡veis Python normais.

O kernel expÃµe seis pontos de entrada pÃºblicos:

InputImages: armazena os frames amostrados
Metadata: contÃ©m frame rate, duraÃ§Ã£o e Ãndices dos frames
tools: expÃµe primitivas de percepÃ§Ã£o e geometria
show(): incorpora uma imagem no prÃ³ximo contexto do agente
vlm: despacha consultas para uma sessÃ£o VLM separada
ReturnAnswer(): submete a resposta final

Duas ferramentas de percepÃ§Ã£o sÃ£o centrais. A tools.Reconstruct utiliza Depth Anything 3 e retorna profundidade por frame, intrÃnsecos e extrÃnsecos da cÃ¢mera, e mapas de pontos densos. A tools.SAM3 utiliza SAM 3 e produz mÃ¡scaras de imagem ou vÃdeo a partir de prompts de texto, ponto ou caixa delimitadora.

O framework Ã© totalmente training-free â€” o mesmo prompt de sistema, conjunto de ferramentas e hiperparÃ¢metros funcionam em todos os benchmarks e backbones.

Por que a Interface de AÃ§Ã£o Importa

A equipe estudou trÃªs interfaces de aÃ§Ã£o na mesma pergunta: medir a distÃ¢ncia mais prÃ³xima entre um aquecedor e uma porta.

Single-pass code: escreve um programa completo e executa uma vez. Assume uma estratÃ©gia antes de ver qualquer mÃ¡scara ou mapa de profundidade. Um erro de suposiÃ§Ã£o se propaga direto para a resposta.
Structured tool-call: invoca ferramentas nomeadas via schema JSON fixo. NÃ£o consegue combinar livremente outputs com NumPy ou SciPy para cÃ¡lculos em tempo de teste. O resultado Ã© incorreto.
SpatialClaw: compÃµe ferramentas em cÃ³digo, inspeciona resultados, e entÃ£o revisa. Primeiro calcula uma distÃ¢ncia de centroide, depois percebe que o centroide usa mediana. O agente troca para scipy.spatial.KDTree e encontra o ponto mais prÃ³ximo real: 0,9439 m contra um ground truth de 0,9 m.

Benchmark e Resultados

O SpatialClaw foi testado em 20 benchmarks distribuÃdos em cinco categorias: single-image, multi-view, general, video/4D, e compreensÃ£o geral de vÃdeo. Ele melhora sobre o baseline sem ferramentas em todos os seis backbones testados â€” variando de 26B a 397B parÃ¢metros nas famÃlias Qwen3.5/3.6 e Gemma4.

ComparaÃ§Ã£o controlada isolando a interface (backbone Gemma4-31B):

Interface de AÃ§Ã£o	MÃ©dia (20 bench.)	Î” vs no-tool
No-tool baseline	53,4	â€”
Single-pass code	55,2	+1,8
Structured tool-call	56,7	+3,3
SpatialClaw (code as action)	59,9	+6,5

Os ganhos mais expressivos estÃ£o em tarefas dinÃ¢micas. No Gemma4-31B, o DSI-Bench subiu +17,6 pontos e o MindCube subiu +15,3 pontos â€” categorias que exigem computaÃ§Ã£o geomÃ©trica encadeada entre frames e pontos de vista.

Por que Isso Importa

O SpatialClaw mostra que a interface de aÃ§Ã£o Ã© tÃ£o importante quanto o modelo em si. Ao tratar cÃ³digo como a linguagem de aÃ§Ã£o do agente, a NVIDIA conseguiu ganhos substanciais sem nenhum fine-tuning. Isso abre caminho para agentes de IA mais capazes em tarefas que exigem raciocÃnio espacial â€” de robÃ³tica a navegaÃ§Ã£o autÃ´noma e AR/VR.

O cÃ³digo e o paper estÃ£o disponÃveis no site oficial do projeto.

19 de junho de 2026

Ferramentas Server-Side para Agentes de IA: Arquitetura, LatÃªncia e Quando Migrar

Todo agente de IA eventualmente encontra o mesmo problema estrutural: o modelo consegue raciocinar, mas nÃ£o consegue agir sem ferramentas. AlguÃ©m precisa executar essas ferramentas â€” buscar resultados de pesquisa, consultar o banco de dados, chamar a API â€” e esse “alguÃ©m” geralmente Ã© o seu cÃ³digo.

A maioria das equipes constrÃ³i isso da mesma forma: o modelo retorna uma chamada de ferramenta (tool call), seu cÃ³digo a captura, executa a ferramenta, formata o resultado e envia de volta. Repita atÃ© que o modelo tenha o que precisa para responder. O loop funciona, mas significa que sua equipe mantÃ©m toda a camada de ferramentas: conexÃµes, credenciais, lÃ³gica de retry, tratamento de erros e observabilidade â€” nada disso Ã© o seu produto.

Existe uma alternativa: mover a execuÃ§Ã£o das ferramentas para dentro da camada de inferÃªncia, para que as ferramentas sejam executadas como parte da chamada da API, e nÃ£o entre chamadas.

O que sÃ£o Server-Side Tools?

Server-Side Tools (Ferramentas do Lado do Servidor) permitem que vocÃª adicione execuÃ§Ã£o de ferramentas diretamente nas requisiÃ§Ãµes de inferÃªncia. VocÃª continua usando suas chaves de acesso ao modelo, mas o prÃ³prio servidor gerencia a execuÃ§Ã£o das ferramentas, sem que seu cÃ³digo precise orquestrar cada passo do loop.

Client-side vs Server-side

Client-side (lado do cliente): melhor para desenvolvimento. VocÃª tem visibilidade total, debug local e controle sobre cada chamada. Ideal para prototipagem e iteraÃ§Ã£o rÃ¡pida.

Server-side (lado do servidor): melhor para produÃ§Ã£o. Remove a sobrecarga de infraestrutura quando vocÃª estÃ¡ pronto para enviar para produÃ§Ã£o. O servidor gerencia o loop de ferramentas, retry e formataÃ§Ã£o.

LatÃªncia e cold starts

Um ponto importante: cold starts ainda sÃ£o responsabilidade sua. Se o seu servidor MCP (Model Context Protocol) “esfriar” por inatividade, o tempo de inicializaÃ§Ã£o aparece no tempo de resposta da sua API. A recomendaÃ§Ã£o Ã© manter os servidores MCP aquecidos para produÃ§Ã£o.

Falha de ferramenta â‰ falha do agente

Ã‰ importante separar as preocupaÃ§Ãµes: uma ferramenta que retorna timeout Ã© um problema de infraestrutura. O modelo respondendo mal mesmo com ferramentas funcionando Ã© um problema de prompt. Acompanhe essas mÃ©tricas separadamente.

Quando usar Tool Search

Se vocÃª tem mais de 20 a 30 definiÃ§Ãµes de ferramentas, o Tool Search (busca preguiÃ§osa de ferramentas) reduz o custo de tokens de entrada em cada turno. Abaixo desse nÃºmero, carregar todas as ferramentas a cada requisiÃ§Ã£o funciona bem.

MCP e rede

Para uso server-side, os servidores MCP precisam estar publicamente acessÃveis. Se suas ferramentas vivem em uma rede privada, use MCP client-side como alternativa.

Observabilidade desde o inÃcio

Configure tracing antes de precisar. Quando algo quebrar em produÃ§Ã£o, vocÃª vai querer saber exatamente qual chamada de ferramenta causou o problema. A API de Agent Tracing permite rastrear cada passo do agente.

ConclusÃ£o

A escolha entre client-side e server-side tools depende do estÃ¡gio do seu produto. Em desenvolvimento, o client-side oferece flexibilidade. Em produÃ§Ã£o, o server-side reduz complexidade operacional. O importante Ã© entender os trade-offs de latÃªncia, alcance de rede e observabilidade antes de decidir.

19 de junho de 2026
Python 3.14 e seu Novo Compilador JIT: O Fim da LentidÃ£o?

O lanÃ§amento do Python 3.14 marca um ponto importante na evoluÃ§Ã£o de uma das linguagens de programaÃ§Ã£o mais populares do mundo. Embora o Python seja reconhecido por sua legibilidade e vasto ecossistema, sua velocidade de execuÃ§Ã£o sempre foi o “elefante na sala”. Com a versÃ£o 3.14, a equipe do CPython entregou duas das funcionalidades mais aguardadas dos Ãºltimos tempos.

O fim do GIL

A verdadeira concorrÃªncia agora estÃ¡ disponÃvel no Python. O GIL (Global Interpreter Lock), que por dÃ©cadas limitou a execuÃ§Ã£o paralela a uma Ãºnica thread por vez, foi removido de forma opcional. Isso significa que vocÃª pode finalmente aproveitar mÃºltiplos nÃºcleos de CPU em Python sem workarounds como multiprocessing.

O compilador JIT (Just-In-Time)

O JIT Ã© a grande novidade que vamos explorar aqui. Trata-se de um recurso experimental que agora vem empacotado diretamente nos instaladores oficiais â€” resultado de anos de preparaÃ§Ã£o arquitetural da equipe do CPython.

Como funciona?

No Python tradicional (CPython), seu cÃ³digo Ã© compilado para bytecode, que Ã© interpretado linha por linha pela mÃ¡quina virtual. O JIT muda esse fluxo: ele monitora quais partes do cÃ³digo sÃ£o executadas com mais frequÃªncia (os “hot paths”). Quando uma funÃ§Ã£o ou loop Ã© considerado “quente”, o JIT traduz o bytecode para cÃ³digo de mÃ¡quina nativo â€” instruÃ§Ãµes que a CPU entende diretamente. Na prÃ³xima execuÃ§Ã£o, nÃ£o hÃ¡ interpretaÃ§Ã£o: o cÃ³digo roda diretamente.

Copy-and-patch

O JIT do Python 3.14 usa uma tÃ©cnica chamada “copy-and-patch”, que o torna leve e portÃ¡til entre diferentes arquiteturas de CPU sem precisar de um backend de compilaÃ§Ã£o complexo como o LLVM. Isso Ã© fundamental para manter a simplicidade que a comunidade Python valoriza.

O que mudou em relaÃ§Ã£o ao 3.13?

O Python 3.13 jÃ¡ tinha um JIT experimental, mas ele vinha desabilitado por padrÃ£o â€” era preciso compilar o CPython a partir do cÃ³digo-fonte com flags especÃficas como --enable-experimental-jit. No 3.14, o JIT estÃ¡ disponÃvel nos instaladores oficiais .msi (Windows) e .pkg (macOS), bastando ativÃ¡-lo com uma flag de runtime.

Benchmarks iniciais

Os primeiros testes mostram ganhos expressivos em workloads com loops pesados e operaÃ§Ãµes numÃ©ricas â€” exatamente onde o Python tradicional mais sofre. FunÃ§Ãµes matemÃ¡ticas, processamento de dados e algoritmos que executam muitas iteraÃ§Ãµes sÃ£o os maiores beneficiados.

Vale a pena migrar?

Se vocÃª trabalha com ciÃªncia de dados, machine learning ou qualquer Ã¡rea que dependa de processamento intensivo em Python, o 3.14 com JIT ativado merece sua atenÃ§Ã£o. O fato de ser opcional significa que vocÃª pode testar sem riscos: ative o JIT, rode seus benchmarks e decida se o ganho compensa.

O Python estÃ¡ ficando mais rÃ¡pido â€” e o JIT do 3.14 Ã© a prova concreta de que a linguagem estÃ¡ evoluindo sem perder sua essÃªncia.

19 de junho de 2026
Governo dos EUA proÃbe Anthropic de liberar Fable 5 e Mythos 5: aliados reagem e Europa pede soberania em IA

O governo dos Estados Unidos emitiu uma ordem sem precedentes na indÃºstria de inteligÃªncia artificial: proibiu a Anthropic de disponibilizar seus dois modelos mais avanÃ§ados â€” Fable 5 e Mythos 5 â€” para qualquer pessoa fora do paÃs, incluindo aliados histÃ³ricos. A decisÃ£o provocou uma crise diplomÃ¡tica, reacendeu o debate sobre soberania tecnolÃ³gica e colocou em xeque o futuro do acesso global Ã IA de ponta.

O que aconteceu

Na Ãºltima semana, o governo Trump emitiu uma ordem de controle de exportaÃ§Ã£o que forÃ§ou a Anthropic a retirar completamente do ar os modelos Fable 5 e Mythos 5 para garantir conformidade. A empresa jÃ¡ havia concedido acesso ao Claude Mythos Preview para 200 instituiÃ§Ãµes em 15 paÃses para testes de vulnerabilidade, e as versÃµes pÃºblicas estavam programadas para lanÃ§amento no inÃcio de junho.

A Anthropic afirmou que o governo dos EUA nÃ£o forneceu uma razÃ£o oficial para a ordem, mas que seu entendimento Ã© de que a administraÃ§Ã£o Trump acreditava ter descoberto um mÃ©todo de “jailbreaking” do Fable 5 â€” uma tÃ©cnica para contornar as salvaguardas de seguranÃ§a do modelo.

“Corrija este cÃ³digo”: as trÃªs palavras que acionaram o alarme

Segundo a Fortune, tudo comeÃ§ou com trÃªs palavras: “Fix this code” (Corrija este cÃ³digo). Um prompt aparentemente inofensivo teria demonstrado uma capacidade do Fable 5 que alarmou as agÃªncias de seguranÃ§a nacional dos EUA, levando Ã ordem de bloqueio em questÃ£o de dias.

O caso levantou questÃµes sobre o equilÃbrio entre seguranÃ§a nacional e inovaÃ§Ã£o: o Fable 5 foi bloqueado, mas o GPT-5.5 da OpenAI â€” um modelo de capacidade comparÃ¡vel â€” nÃ£o sofreu a mesma restriÃ§Ã£o, como apontou o Mashable.

Terremoto na Europa: Macron chama decisÃ£o de “nacionalista”

A proibiÃ§Ã£o enviou ondas de choque imediatas pela Europa, que Ã© fortemente dependente de IA desenvolvida nos EUA. O presidente francÃªs Emmanuel Macron classificou a ordem como um “alerta” sobre os perigos da IA, mas criticou duramente a abordagem:

“A reaÃ§Ã£o Ã©, em alguns aspectos, estritamente nacionalista. Os limites sÃ£o uma coisa ruim.”

Macron falou durante a reuniÃ£o do G7 esta semana, alertando contra o perigo da “nÃ£o cooperaÃ§Ã£o entre democracias”. O porta-voz da ComissÃ£o Europeia para soberania tecnolÃ³gica, Thomas Regnier, reforÃ§ou que abordar questÃµes de seguranÃ§a em IA Ã© um “desafio compartilhado, nÃ£o confinado a uma Ãºnica jurisdiÃ§Ã£o ou paÃs”.

“Uma naÃ§Ã£o que depende de outros para sua tecnologia pode ser desconectada da noite para o dia”

O impacto mais profundo da decisÃ£o americana foi acelerar os apelos por autossuficiÃªncia tecnolÃ³gica entre os aliados dos EUA. O primeiro-ministro canadense Mark Carney declarou:

“A situaÃ§Ã£o em que estamos coletivamente agora com Mythos e Fable Ã© algo que pode acontecer com dependÃªncia excessiva. NinguÃ©m fez nada de errado nesta situaÃ§Ã£o. Mas teremos feito algo errado se simplesmente aceitarmos isso, nÃ£o aprendermos a liÃ§Ã£o e nÃ£o diversificarmos.”

O ex-ministro francÃªs Bruno Retailleau, candidato Ã presidÃªncia em 2027, foi ainda mais direto:

“Uma naÃ§Ã£o que depende de outros para sua tecnologia Ã© uma naÃ§Ã£o que pode ser desconectada da noite para o dia. Devemos tratar a IA como tratamos a energia nuclear: devemos pensar nela como parte de nossa soberania. DominÃ¡-la ou sofrÃª-la: nÃ£o hÃ¡ outro caminho.”

O “efeito Streisand” da proibiÃ§Ã£o

Ironicamente, o banimento pode estar ajudando a marca da Anthropic. A cobertura massiva da mÃdia global â€” da Al Jazeera Ã Forbes, do Time Ã NBC News â€” transformou o Fable 5 no modelo de IA mais comentado do momento.

Enquanto isso, modelos open-source correram para preencher a lacuna: segundo o The New Stack, quatro modelos abertos diferentes responderam Ã demanda antes mesmo que a Anthropic pudesse restaurar o acesso. A empresa tambÃ©m lanÃ§ou uma nova polÃtica de privacidade oferecendo uma alternativa para consumidores americanos contornarem as restriÃ§Ãµes, conforme reportou a CIO.com.

O que estÃ¡ em jogo

Para os investidores, a proibiÃ§Ã£o chega em um momento crÃtico: a Anthropic se prepara para um IPO e a decisÃ£o do governo americano adiciona uma camada de incerteza regulatÃ³ria sem precedentes. Para os desenvolvedores que construÃam sobre a plataforma, o bloqueio repentino foi um lembrete brutal dos riscos de depender de um Ãºnico fornecedor de IA.

Para o mundo, o caso Fable 5 Ã© um marco: a primeira vez que um governo ocidental bloqueia o acesso a um modelo de IA de ponta por razÃµes de seguranÃ§a nacional â€” e um sinal claro de que a geopolÃtica da inteligÃªncia artificial entrou em uma nova fase.

O que vocÃª acha? A decisÃ£o do governo americano foi acertada ou exagerada? A Europa deveria acelerar seus prÃ³prios modelos de IA? Deixe sua opiniÃ£o nos comentÃ¡rios.

19 de junho de 2026
Filme Sobre Sam Altman Ã© Abandonado pela Amazon MGM

O filme Artificial, dirigido por Luca Guadagnino e estrelado por Andrew Garfield como Sam Altman, foi abandonado pela Amazon MGM, segundo informaÃ§Ãµes do Puck e confirmadas pelo Deadline.

O longa, que cobre os cinco dias turbulentos de 2023 em que Altman foi demitido e recontratado como CEO da OpenAI, estava em desenvolvimento hÃ¡ cerca de um ano. O elenco tambÃ©m inclui Monica Barbaro (de A Complete Unknown) como a CTO da OpenAI, Mira Murati, Ike Barinholtz como Elon Musk, e Yura Borisov (de Anora) como o cientista-chefe da OpenAI, Ilya Sutskever.

Em comunicado ao Deadline, o estÃºdio afirmou que acredita que o filme “serÃ¡ mais bem servido se for lanÃ§ado por um estÃºdio diferente e estÃ¡ trabalhando em estreita colaboraÃ§Ã£o com a equipe de filmagem para encontrar um novo lar para o filme”.

LaÃ§os entre Amazon e OpenAI

A decisÃ£o ocorre em meio aos laÃ§os comerciais cada vez mais estreitos entre Amazon e OpenAI. Em fevereiro, a Amazon anunciou um investimento de US$ 50 bilhÃµes no laboratÃ³rio de IA, consolidando a AWS como principal parceira de nuvem da OpenAI. O investimento massivo levanta questÃµes sobre se a decisÃ£o de abandonar o filme tem relaÃ§Ã£o com a parceria estratÃ©gica entre as duas empresas.

Uma histÃ³ria que Hollywood queria contar

O projeto de Guadagnino havia gerado grande expectativa em Hollywood por ser uma das primeiras produÃ§Ãµes de grande orÃ§amento a abordar os eventos dramÃ¡ticos de novembro de 2023 â€” o fim de semana em que Altman foi abruptamente demitido pelo conselho da OpenAI, seguido por uma revolta de funcionÃ¡rios, ameaÃ§as de demissÃ£o em massa e sua reintegraÃ§Ã£o dias depois, em um dos episÃ³dios mais surreais da histÃ³ria do Vale do SilÃcio.

Com Andrew Garfield no papel principal e um diretor aclamado como Guadagnino (Call Me By Your Name, Challengers), o filme prometia ser um dos lanÃ§amentos mais comentados sobre o mundo da tecnologia.

Ainda nÃ£o hÃ¡ informaÃ§Ãµes sobre qual estÃºdio poderia assumir o projeto, mas fontes indicam que outras distribuidoras jÃ¡ demonstraram interesse.

Fonte: The Verge

19 de junho de 2026
BilionÃ¡rio Ambani Quer IA em Cada Chamada, App e Casa

Enquanto a Ãndia busca um competidor local na corrida global da inteligÃªncia artificial, o bilionÃ¡rio Mukesh Ambani estÃ¡ posicionando a Reliance Industries como campeÃ£ nacional, lanÃ§ando serviÃ§os de IA para chamadas telefÃ´nicas, aplicativos mÃ³veis e casas conectadas.

Na reuniÃ£o anual de acionistas na sexta-feira, o conglomerado sediado em Mumbai anunciou o Jio Call Agent, um assistente de IA que pode participar de chamadas telefÃ´nicas para transcrever conversas, gerar resumos e realizar tarefas como reservar transporte, pedir comida e fazer reservas. O serviÃ§o, que pode ser ativado dizendo “Hey Jio”, deve ser lanÃ§ado ainda este ano para os mais de 500 milhÃµes de usuÃ¡rios da Jio.

Ao integrar o serviÃ§o diretamente na sua rede de telecomunicaÃ§Ãµes em vez de oferecÃª-lo como um aplicativo independente, a Jio aposta que a assistÃªncia de IA pode se tornar um recurso nativo das chamadas telefÃ´nicas. A abordagem pode reduzir a dependÃªncia dos consumidores de aplicativos de terceiros e dar Ã Reliance uma vantagem de distribuiÃ§Ã£o poderosa em um mercado de IA cada vez mais concorrido.

Um ecossistema completo de IA

A Reliance tambÃ©m revelou uma versÃ£o com IA do seu aplicativo MyJio, capaz de realizar tarefas em nome dos usuÃ¡rios â€” desde ativar eSIMs atÃ© selecionar planos de roaming â€” por meio de comandos em linguagem natural. A empresa tambÃ©m apresentou o TeleFrame, um display domÃ©stico que usa agentes de IA para exibir proativamente informaÃ§Ãµes e recomendaÃ§Ãµes, como alertas meteorolÃ³gicos, agendas e lembretes domÃ©sticos.

Os anÃºncios marcam a prÃ³xima fase das ambiÃ§Ãµes de IA da Reliance, enquanto a Ãndia busca construir capacidades domÃ©sticas em um campo amplamente dominado por empresas dos Estados Unidos e da China. O movimento segue o lanÃ§amento da Reliance Intelligence no ano passado, por meio da qual o conglomerado pretende desenvolver infraestrutura e serviÃ§os de IA para consumidores, empresas e governos, incluindo aplicaÃ§Ãµes que suportam 22 idiomas indianos.

“A Ãndia nÃ£o deve ser uma mera consumidora de IA criada em outros lugares. Deve se tornar criadora, adotante e lÃder global em IA”, disse Ambani, de 69 anos.

Investimentos massivos e parcerias estratÃ©gicas

A Reliance vem acelerando suas ambiÃ§Ãµes de IA por meio de parcerias com Google, Meta e Nvidia. No inÃcio deste ano, a empresa anunciou planos de investir US$ 110 bilhÃµes em infraestrutura de IA, enquanto busca se estabelecer como uma grande player no emergente ecossistema de IA da Ãndia.

Na reuniÃ£o de acionistas, a Reliance tambÃ©m revelou um conjunto de serviÃ§os de IA para saÃºde, educaÃ§Ã£o, agricultura e pequenas empresas. Os produtos, batizados de JioHealthIQ, JioLearnIQ, JioKrishiIQ e AI Vyapar, sÃ£o projetados para operar em vÃ¡rios idiomas indianos e atender Ã s necessidades locais.

O encontro tambÃ©m trouxe uma grande novidade para investidores que aguardam a estreia da Jio na bolsa de valores. Ambani disse que o conselho da Jio Platforms aprovou um prospecto preliminar para uma oferta pÃºblica inicial (IPO) que incluiria uma emissÃ£o de atÃ© 270 milhÃµes de aÃ§Ãµes.

Fonte: TechCrunch

19 de junho de 2026
Subquadratic afirma ter resolvido o gargalo matemÃ¡tico dos transformers â€” e tem benchmarks independentes para provar

A startup de Miami Subquadratic saiu do stealth com uma afirmaÃ§Ã£o ousada: resolveu um gargalo matemÃ¡tico que limita os modelos de linguagem hÃ¡ quase uma dÃ©cada. Um mÃªs depois, a empresa comeÃ§ou a mostrar as provas.

O problema Ã© a atenÃ§Ã£o densa (dense attention), o mecanismo central dos transformers. Quando um LLM processa texto, cada token precisa ser multiplicado por todos os outros tokens. Isso gera uma expansÃ£o quadrÃ¡tica de computaÃ§Ãµes â€” dobre o texto e vocÃª quadruplica os cÃ¡lculos. Ã‰ por isso que rodar modelos como GPT-4 e Claude custa caro, consome energia absurda e fica lento com contextos longos.

A Subquadratic diz ter resolvido isso com atenÃ§Ã£o esparsa dinÃ¢mica (sparse attention). Em vez de multiplicar cada token por todos os outros, o modelo seleciona dinamicamente apenas as relaÃ§Ãµes importantes. “AtenÃ§Ã£o esparsa diz que nem todas essas relaÃ§Ãµes sÃ£o importantes, porque elas nÃ£o sÃ£o”, explica Alex Whedon, CTO e cofundador. “Se vocÃª estÃ¡ lendo um livro, nÃ£o vai comparar a primeira com a segunda palavra, primeira com a terceira â€” isso Ã© insano.”

O resultado Ã© o SubQ, um LLM que segundo a empresa Ã© atÃ© 56 vezes mais rÃ¡pido que modelos usando FlashAttention, processa 12 vezes mais texto de uma vez e consome muito menos energia â€” tudo isso igualando o desempenho dos melhores modelos de OpenAI, Google DeepMind e Anthropic em tarefas como cÃ³digo.

A comunidade recebeu com ceticismo. Dan McAteer, engenheiro de IA, resumiu o clima no X: “SubQ Ã© o maior avanÃ§o desde o Transformer… ou Ã© a Theranos da IA.”

Mas a Subquadratic contratou a Appen, empresa independente que avalia modelos, para rodar seus testes. Os resultados parecem validar as afirmaÃ§Ãµes. “Fiquei tipo ‘uau, isso pode mudar o jogo’”, disse Jeanine Sinanan-Singh, diretora de pesquisa em IA generativa da Appen. “Modelos sofrem com velocidade e ineficiÃªncia.”

O SubQ nÃ£o substitui os modelos atuais em todas as tarefas, mas pode oferecer ganhos enormes de velocidade por uma fraÃ§Ã£o do custo para tarefas especÃficas â€” como analisar centenas de documentos ou bases de cÃ³digo inteiras.

O CEO Justin Dangel Ã© ambicioso: “Esperamos estar iniciando uma nova era de eficiÃªncia. Achamos que ninguÃ©m vai continuar construindo sobre transformers densos.”

A startup ainda nÃ£o liberou o SubQ para testes pÃºblicos, mas prometeu divulgar benchmarks verificados antes de qualquer anÃºncio futuro. O artigo completo da MIT Technology Review tem todos os detalhes tÃ©cnicos: A startup claims it broke through a bottleneck that’s holding back LLMs.

19 de junho de 2026
Liquid AI lanÃ§a LFM2.5-Embedding e ColBERT-350M: novos modelos de busca multilÃngue em 11 idiomas
A Liquid AI â€” startup fundada por ex-pesquisadores do MIT e conhecida por sua arquitetura alternativa aos transformers â€” acaba de lanÃ§ar dois novos modelos de embedding que prometem busca multilÃngue ultrarrÃ¡pida em 11 idiomas, incluindo o portuguÃªs.

Dois modelos, um backbone

Os LFM2.5-Embedding-350M e LFM2.5-ColBERT-350M compartilham o mesmo backbone de 350 milhÃµes de parÃ¢metros, baseado na arquitetura LFM2.5 da Liquid AI. A diferenÃ§a estÃ¡ na forma como representam o texto:
- Embedding (Bi-Encoder Denso): Converte cada documento em um Ãºnico vetor de 1024 dimensÃµes. Ideal para busca rÃ¡pida com o menor Ãndice possÃvel. Escolha quando velocidade e custo de armazenamento sÃ£o prioridade.
- ColBERT (Late-Interaction): Converte cada token em um vetor de 128 dimensÃµes, permitindo comparaÃ§Ã£o palavra por palavra entre consulta e documento. Oferece precisÃ£o superior e melhor generalizaÃ§Ã£o, com o trade-off de um Ãndice maior. TambÃ©m pode ser usado como reranker.
Ambos os modelos sÃ£o voltados para busca de contexto curto, como catÃ¡logos de produtos, bases de conhecimento FAQ e documentaÃ§Ã£o de suporte â€” um encaixe natural para pipelines RAG (Retrieval-Augmented Generation).

Arquitetura bidirecional adaptada

O ponto de partida Ã© o checkpoint LFM2.5-350M-Base, um modelo de uso geral que a Liquid AI adaptou com patches bidirecionais. Originalmente, a arquitetura LFM2 Ã© causal (cada token olha apenas para o passado), o que funciona para geraÃ§Ã£o de texto, mas nÃ£o Ã© ideal para recuperaÃ§Ã£o de informaÃ§Ã£o.

A equipe substituiu a mÃ¡scara de atenÃ§Ã£o causal por uma bidirecional, permitindo que cada token atenda ao contexto tanto Ã esquerda quanto Ã direita. As convoluÃ§Ãµes curtas tambÃ©m foram tornadas nÃ£o-causais, misturando informaÃ§Ãµes locais simetricamente ao redor de cada token.

O resultado: 17 camadas (10 de convoluÃ§Ã£o, 6 de atenÃ§Ã£o e 1 de pooling/densa), contexto de atÃ© 32.768 tokens e documentos afinados para 512 tokens â€” preservando a eficiÃªncia do backbone LFM2 enquanto produz as representaÃ§Ãµes de contexto completo que a recuperaÃ§Ã£o exige.

Resultados em 11 idiomas

Os modelos foram avaliados em dois benchmarks:
- NanoBEIR: recuperaÃ§Ã£o multilÃngue
- MKQA-11: QA cross-lingual de domÃnio aberto
Ambos cobrem 11 idiomas: Ã¡rabe, alemÃ£o, inglÃªs, espanhol, francÃªs, italiano, japonÃªs, coreano, norueguÃªs, portuguÃªs e sueco.

O ColBERT lidera em ambas as mÃ©dias, com 0,605 no NanoBEIR (melhoria significativa sobre os 0,540 do LFM2-ColBERT-350M anterior). O Embedding chega perto no MKQA-11, com 0,691. Ambos superam o Qwen3-Embedding-0.6B, um modelo maior.

LatÃªncia e deploy

A Liquid AI disponibilizou variantes GGUF para llama.cpp, permitindo execuÃ§Ã£o em CPUs, laptops e dispositivos edge. Em uma MacBook Pro M4 Max (FP16), a latÃªncia mediana de consulta fica abaixo de 10 ms para embeddings prÃ©-computados. Em GPUs H100 (FP16), as latÃªncias chegam a 1 ms.

Para uso via Python, o Embedding roda com sentence-transformers e o ColBERT com PyLate, incluindo Ãndice PLAID com FastPLAID para busca eficiente de similaridade. Ambos suportam fine-tuning com dados prÃ³prios.

Disponibilidade

Os modelos estÃ£o disponÃveis no Hugging Face sob os identificadores LiquidAI/LFM2.5-Embedding-350M e LiquidAI/LFM2.5-ColBERT-350M. A Liquid AI recomenda o Embedding para pipelines RAG que priorizam custo e velocidade, e o ColBERT quando a precisÃ£o Ã© o fator decisivo â€” especialmente em cenÃ¡rios cross-lingual onde a interaÃ§Ã£o tardia captura nuances que embeddings densos podem perder.
19 de junho de 2026
Subquadratic afirma ter resolvido o gargalo que limita os LLMs â€” e os testes independentes mostram velocidade 56x maior

A startup americana Subquadratic saiu do modo stealth no mÃªs passado com uma afirmaÃ§Ã£o ambiciosa: resolveram o gargalo matemÃ¡tico que tem limitado os grandes modelos de linguagem (LLMs) hÃ¡ quase uma dÃ©cada. Agora, a empresa sediada em Miami comeÃ§a a apresentar evidÃªncias independentes que tornam suas alegaÃ§Ãµes muito mais difÃceis de ignorar.

O problema da atenÃ§Ã£o quadrÃ¡tica

Para entender por que as alegaÃ§Ãµes da Subquadratic sÃ£o tÃ£o impactantes, Ã© preciso mergulhar em como os LLMs funcionam. O mecanismo central de um LLM Ã© um tipo de rede neural chamada transformer, que executa um processo conhecido como atenÃ§Ã£o densa (“dense attention”). Quando um transformer processa um texto, ele codifica cada palavra (ou token) com um nÃºmero e depois multiplica cada nÃºmero por todos os outros nÃºmeros daquele texto. Um texto de 10.000 palavras dispara quase 50 milhÃµes de multiplicaÃ§Ãµes individuais.

Conforme o texto aumenta, o nÃºmero de cÃ¡lculos dispara de forma quadrÃ¡tica â€” dobre o nÃºmero de palavras e vocÃª quadruplica os cÃ¡lculos. Ã‰ por isso que os LLMs sÃ£o notÃ³rios devoradores de energia e dinheiro.

SubQ: atenÃ§Ã£o esparsa e velocidade 56x maior

A soluÃ§Ã£o da Subquadratic Ã© abandonar a atenÃ§Ã£o densa em favor da atenÃ§Ã£o esparsa (“sparse attention”), que reduz drasticamente os cÃ¡lculos. Em vez de multiplicar cada token por todos os outros, o modelo seleciona dinamicamente quais pares de tokens sÃ£o relevantes para o contexto especÃfico.

“Se vocÃª estÃ¡ lendo um livro, vocÃª nÃ£o vai comparar a primeira e a segunda palavra, primeira e terceira â€” isso Ã© insano”, explica Alex Whedon, CTO e cofundador da Subquadratic.

O modelo se chama SubQ e, segundo testes independentes conduzidos pela empresa Appen, Ã© 56 vezes mais rÃ¡pido que modelos que usam FlashAttention (a tÃ©cnica anterior de atenÃ§Ã£o esparsa). Em benchmarks de cÃ³digo como o LiveCodeBench, o SubQ atingiu 89,7% de precisÃ£o â€” competitivo com os melhores modelos de codificaÃ§Ã£o do mercado.

Custo e capacidade de contexto sem precedentes

O SubQ possui uma janela de contexto de atÃ© 12 milhÃµes de tokens â€” 12 vezes maior que a maioria dos modelos atuais, limitados a cerca de 1 milhÃ£o. Em uma demonstraÃ§Ã£o, o SubQ processou e raciocinou sobre 400 documentos simultÃ¢neos em segundos. Quando o Perplexity recebeu a mesma tarefa, sequer conseguiu carregar todos os documentos.

Em termos de custo, a diferenÃ§a Ã© ainda mais gritante: executar o Opus 4.6 da Anthropic no teste RULER 128 custa cerca de US$ 2.600. O SubQ? Oito dÃ³lares.

Nos testes de “needle-in-a-haystack”, o SubQ obteve 98% de precisÃ£o com janelas de contexto de 6 e 12 milhÃµes de tokens â€” praticamente perfeito em escalas que poucos modelos sequer testam.

Ceticismo justificado

Apesar dos nÃºmeros impressionantes, o ceticismo Ã© compreensÃvel. A Subquadratic Ã© uma empresa pequena com recursos limitados, e o modelo ainda nÃ£o estÃ¡ amplamente disponÃvel para testes pÃºblicos. Dezenas de milhares jÃ¡ se inscreveram na lista de espera, incluindo mais de 500 clientes empresariais, mas poucos tiveram acesso atÃ© agora.

Outro ponto levantado por pesquisadores: a Subquadratic reutilizou pesos de um modelo open-source chinÃªs (Qwen) para inicializar o SubQ, em vez de treinar do zero. Embora seja uma prÃ¡tica comum na indÃºstria, isso enfraquece a alegaÃ§Ã£o de terem reinventado completamente o funcionamento dos LLMs.

“A evidÃªncia pÃºblica ainda nÃ£o justifica a alegaÃ§Ã£o mais forte de que eles resolveram o gargalo da atenÃ§Ã£o quadrÃ¡tica”, pondera Will Depue, pesquisador independente que trabalhou anteriormente na OpenAI.

Uma nova era de eficiÃªncia?

A Subquadratic insiste que a reinvenÃ§Ã£o Ã© o Ãºnico caminho para startups competirem com gigantes. “Esperamos estar iniciando uma nova era de eficiÃªncia”, diz Justin Dangel, CEO e cofundador. “Achamos que ninguÃ©m estarÃ¡ construindo em cima de transformers daqui a alguns anos.”

Se o SubQ cumprir o que promete, a equaÃ§Ã£o da IA generativa pode mudar radicalmente â€” mais rÃ¡pida, mais barata e capaz de processar volumes de dados antes impensÃ¡veis. O copo estÃ¡ meio cheio de evidÃªncias, mas o gole final ainda depende de acesso pÃºblico e testes independentes em larga escala.

19 de junho de 2026
EUA acusam ASML de enviar mÃ¡quina de chips EUV para a China; empresa nega
EUA acusam ASML de enviar mÃ¡quina de chips EUV para a China; empresa nega veementemente

Segundo a Bloomberg, o SecretÃ¡rio de ComÃ©rcio dos EUA, Howard Lutnick, disse a executivos seniores da ASML que estÃ¡ preocupado com a possibilidade de uma das mÃ¡quinas de litografia ultravioleta extrema (EUV) da fabricante holandesa â€” os Ãºnicos equipamentos capazes de imprimir os padrÃµes de semicondutores mais avanÃ§ados do planeta â€” ter parado na China. Se confirmado, seria uma violaÃ§Ã£o grave dos controles de exportaÃ§Ã£o que proÃbem a venda de EUV para a China desde o primeiro governo Trump.

A ASML nega categoricamente. “Nenhuma mÃ¡quina desse tipo existe na China e nunca existiu”, afirma a empresa. O Departamento de ComÃ©rcio se recusou a responder se tem evidÃªncias de um sistema EUV real em solo chinÃªs.

Por que isso importa

A ASML Ã© uma empresa holandesa que a maioria das pessoas nunca ouviu falar, mas Ã©, de longe, a companhia mais importante na infraestrutura global de IA que nÃ£o se chama Nvidia ou estÃ¡ entre os hyperscalers. Ela fabrica as Ãºnicas mÃ¡quinas do planeta capazes de litografia EUV â€” o processo de imprimir os circuitos microscÃ³picos que definem os chips mais avanÃ§ados.

Cada processador de ponta feito pela TSMC, a fundiÃ§Ã£o por trÃ¡s dos chips da Nvidia e da Apple, depende de ferramentas da ASML que levaram cerca de duas dÃ©cadas e bilhÃµes incalculÃ¡veis para desenvolver. NÃ£o existe segundo fornecedor. Esse monopÃ³lio fez da ASML a empresa pÃºblica mais valiosa da Europa, com valor de mercado oscilando em torno de US$ 700 bilhÃµes.

Ã‰ exatamente essa escala que torna a questÃ£o da China tÃ£o crÃtica. Se uma Ãºnica mÃ¡quina EUV chegou Ã s mÃ£os chinesas, isso representaria uma das violaÃ§Ãµes mais sÃ©rias do regime de controle de exportaÃ§Ã£o que os EUA construÃram nos Ãºltimos anos para manter a capacidade avanÃ§ada de IA fora da base militar e industrial de Pequim.

A defesa da ASML

Em entrevista ao TechCrunch seis semanas antes da notÃcia estourar, o CEO Christophe Fouquet detalhou as salvaguardas da empresa:
- A ASML rastreia cada mÃ¡quina que jÃ¡ enviou â€” elas estÃ£o em uso ativo com clientes monitorados ou foram desmontadas e devolvidas Ã empresa
- A empresa construiu um firewall interno: funcionÃ¡rios com acesso Ã tecnologia EUV sÃ£o isolados dos que nÃ£o tÃªm, e a equipe da ASML na China fica do lado errado desse muro por design
- A ASML sÃ³ conseguiu construir uma mÃ¡quina EUV porque 80% jÃ¡ existia de dÃ©cadas de conhecimento prÃ©vio. Resolver o Ãºnico problema genuinamente novo â€” gerar a luz EUV â€” levou 20 anos sozinho
A mensagem implÃcita de Fouquet: Ã© impossÃvel fazer engenharia reversa de uma mÃ¡quina que nunca se teve, e ninguÃ©m na China teve uma.

HÃ¡ tambÃ©m uma lÃ³gica comercial simples: a ASML espera que cerca de 20% de sua receita de 2026 venha de vendas jÃ¡ permitidas para a China (ferramentas DUV de geraÃ§Ã£o mais antiga). Arriscar a proibiÃ§Ã£o do EUV colocaria essa receita â€” e a posiÃ§Ã£o da empresa como monopÃ³lio mais valioso da indÃºstria europeia â€” em jogo por uma Ãºnica venda ilegal.

Contexto polÃtico delicado

O Departamento de ComÃ©rcio, sob Lutnick, concordou no final do ano passado em investir atÃ© US$ 150 milhÃµes na xLight, uma startup que desenvolve tecnologia de fonte de luz de prÃ³xima geraÃ§Ã£o â€” vista como potencial desafiante de longo prazo ao monopÃ³lio EUV da ASML. O prÃ³prio CEO da xLight afirmou no ano passado que a empresa se vÃª como futura parceira da ASML, nÃ£o rival, construindo hardware para se plugar nas mÃ¡quinas da holandesa em vez de substituÃ-las.

Nada disso prova que as alegaÃ§Ãµes sÃ£o falsas. O governo ainda nÃ£o tornou pÃºblicas suas evidÃªncias, e vale suspender o julgamento atÃ© que o faÃ§a. Mas, por enquanto, o impasse permanece: os EUA dizem que sim, a ASML diz que nÃ£o â€” e o chip mais avanÃ§ado do mundo estÃ¡ no centro dessa disputa geopolÃtica.

Fonte: TechCrunch
19 de junho de 2026
Ensaios de interfaces cÃ©rebro-computador disparam: nÃºmero de voluntÃ¡rios mais que dobra
Ensaios de interfaces cÃ©rebro-computador disparam: nÃºmero de voluntÃ¡rios mais que dobra

O nÃºmero de pessoas com eletrodos implantados no cÃ©rebro mais que dobrou nos Ãºltimos dois anos, saltando de 67 voluntÃ¡rios identificados atÃ© o final de 2023 para uma estimativa de 150 atualmente. Os ensaios clÃnicos de interfaces cÃ©rebro-computador (BCIs) estÃ£o finalmente decolando â€” e os resultados sÃ£o animadores.

O caso de Casey Harrell

Casey Harrell, um homem com ELA (esclerose lateral amiotrÃ³fica), Ã© considerado o “primeiro power user” de um implante cerebral, segundo os pesquisadores que trabalham com ele. Paralisado e incapaz de falar sem o dispositivo, Harrell jÃ¡ passou quase trÃªs anos usando um BCI que permite “falar”, navegar na internet e realizar seu trabalho como ativista climÃ¡tico de forma praticamente independente.

Implantado em julho de 2023 por uma equipe da Universidade da CalifÃ³rnia em Davis, o dispositivo evoluiu significativamente desde entÃ£o. Os pesquisadores refinaram a precisÃ£o e introduziram recursos como modo de privacidade e um “filtro de palavrÃµes” que permite a Harrell conversar com a filha sem risco de xingamentos acidentais.

Para Harrell, o dispositivo Ã© “nada menos que revolucionÃ¡rio”. Permitiu que ele mantivesse sua renda, reconectasse com amigos e famÃlia e lesse para sua filha. Ele Ã© um entre um nÃºmero crescente de voluntÃ¡rios que, como ele mesmo diz, querem “pagar adiante e fazer a pesquisa cientÃfica… [e] obter algum benefÃcio pessoal”.

A explosÃ£o dos ensaios clÃnicos

Em 2024, Michelle Patrick-Krueger e colegas da Universidade de Houston publicaram um levantamento de todos os ensaios de BCI realizados entre 1998 (quando acreditam que o primeiro dispositivo foi implantado) e o final de 2023. Identificaram 21 grupos de pesquisa que testaram BCIs em 67 voluntÃ¡rios no total.

“Desde entÃ£o, esse nÃºmero aumentou muito”, afirma Mariska Vansteensel, pesquisadora de BCI do University Medical Center Utrecht. Em janeiro, a Neuralink (empresa fundada pelo trilionÃ¡rio Elon Musk) anunciou que implantou seu dispositivo em 21 pessoas nos Ãºltimos dois anos.

Outras empresas tambÃ©m estÃ£o na corrida:
- Synchron: testa dispositivos na AmÃ©rica do Norte e AustrÃ¡lia
- Neuracle (Xangai): realiza ensaios desde novembro de 2024 e obteve aprovaÃ§Ã£o para uso fora de estudos clÃnicos
- Precision Neuroscience: cofundada por um ex-cocriador da Neuralink, testa um BCI que fica na superfÃcie do cÃ©rebro
A China, inclusive, tornou-se o primeiro paÃs a aprovar um BCI invasivo para uso mÃ©dico â€” um marco que deve acelerar ainda mais o setor.

Como funcionam os BCIs

Os BCIs vÃªm em diferentes formas. O dispositivo de Harrell inclui eletrodos embutidos no cÃ©rebro que captam a atividade elÃ©trica associada Ã fala, conectados a duas portas no topo da cabeÃ§a que se plugam em um computador. O software decodifica os sinais cerebrais em fonemas e prevÃª o que o usuÃ¡rio quer dizer.

Mas alguns BCIs sÃ£o totalmente implantados e sem fio. Outros sÃ£o menos invasivos, com eletrodos na superfÃcie do cÃ©rebro ou atÃ© em toucas externas. Quanto mais prÃ³ximo dos neurÃ´nios, melhor o sinal â€” mas maior o risco cirÃºrgico.

A equipe que trabalha com Harrell faz parte do BrainGate, projeto de pesquisa em BCI que jÃ¡ dura duas dÃ©cadas. Nos primeiros 17 anos, o foco era comunicaÃ§Ã£o “apontar e clicar” â€” controlar um cursor com atividade cerebral. Nos Ãºltimos anos, o time pivotou para decodificaÃ§Ã£o de fala. Hoje, o dispositivo de Harrell usa um clone de voz baseado em gravaÃ§Ãµes anteriores da sua prÃ³pria voz.

Desafios pela frente

Apesar do progresso, os BCIs ainda sÃ£o experimentais. A maioria dos implantes foi feita em pessoas com lesÃµes na medula espinhal, e sabemos muito menos sobre como funcionam em outras condiÃ§Ãµes como a ELA. Em alguns casos, dispositivos que inicialmente ajudaram pacientes â€” inclusive pessoas completamente travadas em sÃndrome de encarceramento â€” eventualmente pararam de funcionar. Os cientistas ainda nÃ£o sabem exatamente por quÃª.

“A Ãºnica maneira de descobrir Ã© com mais pesquisa â€” e a participaÃ§Ã£o de voluntÃ¡rios como Harrell”, conclui a autora Jessica Hamzelou, do MIT Technology Review. A expectativa Ã© que o campo esteja completamente diferente dentro de dois anos.

Fonte: MIT Technology Review
19 de junho de 2026
Barret Zoph deixa a OpenAI novamente apÃ³s apenas cinco meses

Barret Zoph, chefe de vendas enterprise da OpenAI, estÃ¡ deixando a empresa apenas cinco meses apÃ³s seu retorno, segundo informaÃ§Ãµes do The Verge.

Zoph havia retornado Ã OpenAI em meados de janeiro, depois de uma passagem como cofundador e CTO da Thinking Machines Lab, a empresa concorrente fundada por Mira Murati, ex-CTO da OpenAI. Ao retornar, a OpenAI o colocou para liderar o avanÃ§o no setor enterprise â€” uma funÃ§Ã£o estratÃ©gica importante, jÃ¡ que a empresa prometeu abandonar as chamadas “side quests” e focar em geradores de receita como enterprise e coding antes do IPO planejado.

Uma saÃda conturbada

A saÃda de Zoph carrega uma histÃ³ria complicada. Ele deixou a OpenAI originalmente no final de 2024 para se juntar Ã Thinking Machines Lab de Murati, mas saiu dessa posiÃ§Ã£o abruptamente em janeiro de 2026 apÃ³s relatos de mÃ¡ conduta envolvendo um relacionamento nÃ£o revelado com uma colega. Murati publicou no X na Ã©poca que a Thinking Machines Lab havia “se separado” de Zoph e que ele seria substituÃdo como CTO.

A Thinking Machines Lab tem suas prÃ³prias tensÃµes com a OpenAI. Murati assumiu brevemente o cargo de CEO durante a remoÃ§Ã£o de Sam Altman em novembro de 2023 e, durante o recente julgamento da OpenAI, testemunhou que nÃ£o podia confiar em tudo que Altman dizia.

O vai e vem de talentos

Quando Murati deixou a OpenAI em setembro de 2024 para fundar a Thinking Machines Lab, vÃ¡rios funcionÃ¡rios a seguiram. Mas trÃªs deles â€” incluindo Zoph, Luke Metz e Sam Schoenholz â€” retornaram juntos Ã OpenAI em janeiro deste ano. Fidji Simo, CEO de AplicaÃ§Ãµes da OpenAI, escreveu no X na Ã©poca que estava “animada em receber Barret Zoph, Luke Metz e Sam Schoenholz de volta” e que a decisÃ£o “estava sendo trabalhada hÃ¡ vÃ¡rias semanas”.

A OpenAI confirmou a saÃda de Zoph ao The Verge. Ele publicou uma mensagem de despedida nos canais do Slack da empresa, mas nÃ£o respondeu a pedidos de comentÃ¡rio da imprensa.

Esta movimentaÃ§Ã£o acontece em um momento delicado para a OpenAI, que se prepara para seu IPO enquanto gerencia tensÃµes internas e a concorrÃªncia crescente de startups fundadas por ex-executivos da casa.

19 de junho de 2026