Blog

AWS SageMaker ganha mais de 100 mÃ©tricas detalhadas para inferÃªncia de IA generativa
A Amazon Web Services (AWS) anunciou um salto significativo na observabilidade de endpoints de inferÃªncia de IA generativa no Amazon SageMaker AI. A plataforma agora emite mais de 100 mÃ©tricas detalhadas de inferÃªncia, com um dashboard integrado no Amazon CloudWatch que elimina a necessidade de configuraÃ§Ãµes manuais de Grafana e Prometheus.

O desafio da inferÃªncia em escala

Monitorar e solucionar problemas em endpoints de IA generativa operando em escala Ã© um dos maiores desafios das equipes de MLOps atualmente. Quando a latÃªncia P99 de um endpoint de LLM aumenta, a equipe precisa determinar em minutos se a causa raiz Ã© pressÃ£o de memÃ³ria da GPU, saturaÃ§Ã£o do cache KV, trÃ¡fego desbalanceado entre Zonas de Disponibilidade ou uma polÃtica de auto scaling que nÃ£o foi acionada.

A mudanÃ§a do treinamento para o serving estÃ¡ transformando como as equipes implantam LLMs e outros modelos de IA generativa em produÃ§Ã£o. Engenheiros de plataforma de ML, times de MLOps e SREs precisam manter endpoints de inferÃªncia saudÃ¡veis, responsivos e com custo eficiente â€” frequentemente gerenciando dezenas de modelos e centenas de instÃ¢ncias de GPU.

MÃ©tricas detalhadas: o que hÃ¡ de novo

As novas mÃ©tricas cobrem Ã¡reas crÃticas que antes exigiam instrumentaÃ§Ã£o customizada:
- SaÃºde da GPU: utilizaÃ§Ã£o por acelerador, temperatura, consumo de energia
- LatÃªncia em nÃvel de token: Time to First Token (TTFT) e Inter-Token Latency (ITL)
- PressÃ£o do cache KV: saturaÃ§Ã£o e taxa de acerto/erro
- DistribuiÃ§Ã£o de trÃ¡fego: balanceamento entre Zonas de Disponibilidade
- Posicionamento de componentes de inferÃªncia: distribuiÃ§Ã£o de inference components
- DiagnÃ³stico de cold start: tempo de inicializaÃ§Ã£o e aquecimento de modelos
As mÃ©tricas sÃ£o emitidas nativamente em formato OpenTelemetry e podem ser consultadas via PromQL, permitindo integraÃ§Ã£o com ferramentas externas como Grafana e Datadog para quem jÃ¡ possui stacks de observabilidade estabelecidas.

Dashboard SageMaker Insights

O SageMaker Insights estÃ¡ localizado no console do CloudWatch em Infrastructure Monitoring â†’ SageMaker Insights. O dashboard Ã© organizado em trÃªs abas:
- Performance: saÃºde da frota, latÃªncia de tokens, throughput, erros e pressÃ£o do motor de inferÃªncia
- Capacity: utilizaÃ§Ã£o de GPU, CPU e memÃ³ria da frota
- Reliability: distribuiÃ§Ã£o por Zona de Disponibilidade, eventos de scaling, anatomia de cold starts e erros de capacidade insuficiente
O dashboard suporta tanto Single-Model Endpoints (SME) quanto Inference Component (IC) Endpoints â€” a arquitetura recomendada para cargas de trabalho de IA generativa em produÃ§Ã£o por permitir hospedagem multi-modelo em infraestrutura de GPU compartilhada.

Como ativar

As mÃ©tricas detalhadas podem ser ativadas em endpoints novos (automÃ¡tico por padrÃ£o) ou em endpoints existentes via configuraÃ§Ã£o. Para mÃ©tricas em nÃvel de token (TTFT e ITL), Ã© necessÃ¡rio usar containers vLLM ou SGLang.

Este lanÃ§amento representa um passo importante para tornar a inferÃªncia de IA generativa mais operacional e confiÃ¡vel em ambientes de produÃ§Ã£o, reduzindo o tempo de diagnÃ³stico de horas para minutos.
19 de junho de 2026
Elastic adquire startup de IA DeductiveAI por atÃ© US$ 85 milhÃµes

A Elastic, empresa conhecida pelo Elasticsearch, concordou em adquirir a startup de IA DeductiveAI por atÃ© US$ 85 milhÃµes, segundo uma fonte com conhecimento direto do acordo.

Fundada em 2023, a DeductiveAI saiu do stealth em novembro do ano passado, quando anunciou uma rodada seed de US$ 7,5 milhÃµes liderada pela CRV, com participaÃ§Ã£o da Databricks Ventures, Thomvest Ventures e PrimeSet. O investimento avaliou a startup em US$ 33 milhÃµes, de acordo com o PitchBook.

A aquisiÃ§Ã£o marca uma saÃda rÃ¡pida para a DeductiveAI, que opera em um setor de rÃ¡pido crescimento conhecido como AI SRE (Site Reliability Engineering com IA). Ferramentas de SRE com IA se tornaram essenciais diante do enorme volume de cÃ³digo gerado por inteligÃªncia artificial. Substituir a depuraÃ§Ã£o manual por IA permite que engenheiros de SRE se concentrem mais em desenvolvimento de produto do que em apagar incÃªndios constantemente.

TendÃªncia de aquisiÃ§Ãµes de startups de IA

A aquisiÃ§Ã£o reflete uma tendÃªncia mais ampla: grandes empresas de tecnologia estabelecidas estÃ£o comprando startups nativas de IA para integrar tecnologias baseadas em agentes em suas suÃtes de produtos existentes.

A Elastic, que abriu capital em 2018, Ã© mais conhecida pelo Elasticsearch, o mecanismo de busca e anÃ¡lise que ajuda organizaÃ§Ãµes a armazenar, pesquisar, analisar e monitorar grandes volumes de dados em tempo quase real. Seu software de observabilidade pode se beneficiar significativamente da tecnologia da DeductiveAI.

Segundo a fonte, integrar a tecnologia de IA da DeductiveAI Ã Elastic permitirÃ¡ que os clientes monitorem automaticamente o desempenho e resolvam falhas de sistema em tempo real.

CompetiÃ§Ã£o no setor

A DeductiveAI foi cofundada por Rakesh Kothari, anteriormente VP de engenharia da ThoughtSpot, e Sameer Agarwal, ex-Apache Software Foundation e Meta, que tambÃ©m foi um dos engenheiros fundadores da Databricks.

Embora a DeductiveAI tenha alcanÃ§ado aproximadamente US$ 1 milhÃ£o em receita recorrente anual (ARR), seu crescimento ficou atrÃ¡s da Resolve AI, uma das lÃderes do setor. A Resolve, fundada hÃ¡ dois anos pelo ex-executivo da Splunk Spiros Xanthos, foi avaliada em US$ 1,5 bilhÃ£o em abril, quando levantou uma extensÃ£o de SÃ©rie A de US$ 40 milhÃµes.

O acordo demonstra o apetite contÃnuo do mercado por soluÃ§Ãµes de IA aplicadas a operaÃ§Ãµes de TI e confiabilidade de sistemas â€” um nicho que deve crescer Ã medida que mais cÃ³digo gerado por IA chega Ã produÃ§Ã£o.

19 de junho de 2026
Casa Branca cria regras de IA em tempo real enquanto Anthropic enfrenta restriÃ§Ãµes sem precedentes

Casa Branca cria regras de IA em tempo real enquanto Anthropic enfrenta restriÃ§Ãµes sem precedentes

O governo Trump estÃ¡ criando as regras para inteligÃªncia artificial na hora, sem estrutura regulatÃ³ria clara, e a Anthropic Ã© a primeira grande vÃtima desse improviso. A empresa nÃ£o pode distribuir seus modelos mais avanÃ§ados â€” Claude Mythos e Fable 5 â€” apÃ³s entrar em conflito com o governo, mas ninguÃ©m consegue explicar exatamente o que a companhia fez de errado.

Ao longo de toda essa crise, a Anthropic insiste que nÃ£o violou nenhum procedimento ou regra concreta estabelecida pelo governo. Mas a Casa Branca sustenta que a empresa agiu de forma imprudente, demonstrando que nÃ£o se pode confiar nela para lanÃ§ar tecnologia de fronteira com seguranÃ§a.

RegulaÃ§Ã£o no improviso

“O problema Ã© que a Casa Branca esteve em uma postura extrema anti-regulatÃ³ria e agora se depara com capacidades reais de IA que as pessoas preveem hÃ¡ anos”, diz um ex-funcionÃ¡rio de tecnologia da Casa Branca, que pediu anonimato. “Deveria ter havido preparaÃ§Ã£o e polÃticas para lidar com isso sistematicamente, gerenciando benefÃcios e riscos. Em vez disso, Ã© essa abordagem improvisada que coloca a indÃºstria de IA em um dilema real.”

A administraÃ§Ã£o Trump bloqueou repetidamente esforÃ§os para impor barreiras de seguranÃ§a Ã indÃºstria de IA, argumentando que as regras poderiam prejudicar a inovaÃ§Ã£o americana e fazer o paÃs perder terreno para rivais como a China. O presidente assinou ordens executivas que reverteram iniciativas da era Biden para criar um marco nacional de IA e criou uma forÃ§a-tarefa federal para contestar leis estaduais consideradas onerosas.

O que a Anthropic supostamente fez

A disputa Ã© marcada pela opacidade. Em nenhum momento o governo dos EUA declarou claramente o que a Anthropic fez de errado â€” o melhor que temos Ã© um post no X descrevendo a situaÃ§Ã£o geral, feito pelo conselheiro de tecnologia da Casa Branca David Sacks.

Segundo reportagens do WIRED, autoridades americanas se preocuparam quando souberam, no inÃcio deste mÃªs, que a Anthropic compartilhou o Mythos com a SK Telecom, gigante sul-coreana de telecomunicaÃ§Ãµes que supostamente tem laÃ§os com a China. Em outro caso, o CEO da Amazon, Andy Jassy, levantou preocupaÃ§Ãµes com o secretÃ¡rio do Tesouro Scott Bessent de que algumas barreiras de seguranÃ§a do Claude Fable 5 poderiam ser contornadas.

A Anthropic diz que coordenou com o governo dos EUA o lanÃ§amento do Mythos â€” o que significa que as autoridades poderiam ter levantado o alerta sobre a SK Telecom antecipadamente. A empresa trabalha com a companhia coreana hÃ¡ anos, e o arranjo nunca havia causado problemas de seguranÃ§a nacional antes. Quando a Casa Branca manifestou preocupaÃ§Ã£o, a Anthropic revogou o acesso imediatamente.

ConsequÃªncias severas

Ironicamente, as aÃ§Ãµes da Casa Branca provavelmente prejudicaram exatamente o tipo de inovaÃ§Ã£o que o governo diz querer proteger. A administraÃ§Ã£o Trump exigiu que a Anthropic proibisse todos os estrangeiros de acessar Mythos e Fable 5, impedindo que muitos dos prÃ³prios funcionÃ¡rios da empresa â€” e todos os seus clientes, incluindo Apple, Meta e grande parte da Fortune 500 â€” acessassem seus modelos mais avanÃ§ados.

O precedente para outras big techs

Outros laboratÃ³rios de IA como OpenAI, Google e Meta estÃ£o observando a situaÃ§Ã£o da Anthropic com atenÃ§Ã£o. Muitos lÃderes de IA estÃ£o chegando Ã mesma conclusÃ£o: precisarÃ£o dar Ã Casa Branca acesso antecipado a seus modelos mais recentes e ser extremamente proativos em compartilhar informaÃ§Ãµes sobre lanÃ§amentos futuros. O risco de pegar as autoridades desprevenidas Ã© simplesmente grande demais.

O problema central nÃ£o Ã© que o governo dos EUA esteja tentando garantir que modelos avanÃ§ados de IA tenham salvaguardas adequadas. Ã‰ que a administraÃ§Ã£o Trump agora se vÃª forÃ§ada a tomar decisÃµes regulatÃ³rias em tempo real, sem estrutura, sem regras claras e sem precedentes.

Enquanto isso, o setor inteiro prende a respiraÃ§Ã£o.

Fonte: WIRED

18 de junho de 2026
Baseten levanta US$ 1,5 bilhÃ£o e valuation salta para US$ 13 bilhÃµes em apenas 5 meses

Baseten levanta US$ 1,5 bilhÃ£o e valuation salta para US$ 13 bilhÃµes em apenas 5 meses

A startup de inferÃªncia de IA Baseten estÃ¡ prestes a fechar uma rodada de financiamento impressionante de US$ 1,5 bilhÃ£o, avaliando a empresa em US$ 13 bilhÃµes, segundo informaÃ§Ãµes do Wall Street Journal.

O que torna esse nÃºmero ainda mais surpreendente Ã© o intervalo entre as rodadas. HÃ¡ apenas cinco meses, em janeiro de 2026, a Baseten anunciou uma SÃ©rie E de US$ 300 milhÃµes com valuation de US$ 5 bilhÃµes. E essa rodada veio apenas nove meses depois de uma SÃ©rie D de US$ 150 milhÃµes.

Se confirmada, esta nova rodada representa um aumento de 160% no valuation em menos de seis meses â€” um ritmo quase sem precedentes mesmo no frenÃ©tico mercado de IA.

Split-priced round: valuation turbinado artificialmente?

O WSJ revela que a rodada utiliza uma estrutura de split-priced round, tÃ¡tica que startups estÃ£o adotando para inflar o valuation principal e fazer os investidores-lÃderes parecerem mais bem-sucedidos no papel. Alguns investidores entram com valuation de US$ 13 bilhÃµes, enquanto outros aportam com valuation de US$ 11 bilhÃµes.

A rodada Ã© co-liderada por Spark Capital, Sands Capital, Altimeter Capital e Wellington Management.

A corrida do ouro da inferÃªncia

A Baseten compete no mercado de inferÃªncia de IA como serviÃ§o â€” permitindo que empresas executem modelos de linguagem de grande escala (LLMs) em produÃ§Ã£o sem gerenciar infraestrutura prÃ³pria. Com a explosÃ£o de agentes de IA, RAG (geraÃ§Ã£o aumentada por recuperaÃ§Ã£o) e aplicaÃ§Ãµes que exigem latÃªncia baixÃssima, a demanda por plataformas de inferÃªncia dedicadas disparou.

Concorrentes como Together AI, Fireworks AI e Groq tambÃ©m captaram centenas de milhÃµes nos Ãºltimos meses, confirmando que Wall Street e o venture capital enxergam a inferÃªncia como a prÃ³xima grande frente de infraestrutura de IA â€” depois da corrida pelos chips e data centers.

O frenesi de investimentos levanta questÃµes sobre sustentabilidade. Com valuations dobrando a cada semestre, a pressÃ£o por receita proporcional serÃ¡ enorme quando essas startups eventualmente abrirem capital ou enfrentarem um mercado menos generoso.

Fonte: TechCrunch e Wall Street Journal

18 de junho de 2026
OpenAI Contrata Noam Shazeer, Coautor dos Transformers, e Ex-Assessor da Casa Branca na PreparaÃ§Ã£o para o IPO

A OpenAI estÃ¡ montando um time de peso para sua estreia no mercado pÃºblico. A empresa anunciou a contrataÃ§Ã£o de duas figuras de alto escalÃ£o: Noam Shazeer, lenda do Google DeepMind e coautor do paper que criou os Transformers, e Dean Ball, ex-assessor de polÃtica de IA da Casa Branca no governo Trump.

Noam Shazeer: o pai dos Transformers

Shazeer Ã© um dos nomes mais importantes da IA generativa moderna. Ele Ã© coautor do artigo seminal de 2017 “Attention Is All You Need”, que introduziu a arquitetura Transformer â€” a base de modelos como GPT, Gemini, Claude e praticamente todos os LLMs atuais.

Ele passou quase toda a carreira no Google (desde 2000), com uma pausa de trÃªs anos para fundar a startup de role-playing com IA Character AI. Em um movimento que chamou atenÃ§Ã£o do mercado, o Google recontratou Shazeer em 2023 num acordo de US$ 2,7 bilhÃµes que deu Ã big tech acesso Ã tecnologia da startup.

Sua saÃda do Google para a OpenAI Ã© mais um capÃtulo na intensa guerra de talentos entre os principais laboratÃ³rios de IA â€” Google, OpenAI, Anthropic e Meta.

Shazeer tambÃ©m se envolveu em controvÃ©rsias internas no Google. Segundo o The Information, ele expressou opiniÃµes em fÃ³runs internos sobre identidade transgÃªnero e a guerra em Gaza que levaram a gestÃ£o a deletar suas postagens. Resta saber se essas polÃªmicas o acompanharÃ£o na nova casa.

Dean Ball e o time de “Futuros EstratÃ©gicos”

Ball teve uma passagem rÃ¡pida mas impactante pela Casa Branca, onde ajudou a publicar o America’s AI Action Plan. Depois, voltou ao think tank tecno-libertÃ¡rio Foundation for American Innovation como senior fellow.

Na OpenAI, Ball liderarÃ¡ um novo time chamado Strategic Futures (Futuros EstratÃ©gicos), reportando diretamente ao Chief Strategy Officer Jason Kwon.

Nas palavras de Ball, o mandato do time serÃ¡:

“Ajudar a lideranÃ§a da empresa a moldar a polÃtica de IA de fronteira.”

O time â€” descrito como “pequeno e de alta agÃªncia” â€” focarÃ¡ em riscos catastrÃ³ficos, auto-melhoria recursiva, impacto no mercado de trabalho e a relaÃ§Ã£o entre laboratÃ³rios de fronteira, governos e sociedade.

Ball destacou um ponto crucial: governanÃ§a interna serÃ¡ mais central para o futuro da IA do que a maioria imagina. “Quase por necessidade, os laboratÃ³rios de IA terÃ£o que liderar as decisÃµes de governanÃ§a de IA”, escreveu.

O contexto do IPO

As contrataÃ§Ãµes acontecem num momento estratÃ©gico. A OpenAI se prepara para um dos IPOs mais aguardados do setor de tecnologia, e ter nomes como Shazeer (credibilidade tÃ©cnica) e Ball (credibilidade regulatÃ³ria) no time envia um sinal claro ao mercado.

Shazeer traz o peso acadÃªmico e tÃ©cnico. Ball traz a ponte com Washington â€” algo cada vez mais crÃtico conforme a regulaÃ§Ã£o de IA avanÃ§a nos EUA e no mundo.

A danÃ§a das cadeiras entre os grandes laboratÃ³rios de IA estÃ¡ longe de terminar. Mas uma coisa Ã© certa: a OpenAI estÃ¡ se armando com alguns dos nomes mais influentes do setor para o que promete ser uma das maiores estreias na bolsa dos prÃ³ximos anos.

18 de junho de 2026

Perplexity LanÃ§a Brain: Sistema de MemÃ³ria Auto-Evolutiva que ConstrÃ³i Grafo de Contexto do Trabalho do Agente

A Perplexity acaba de lanÃ§ar o Brain, um sistema de memÃ³ria auto-evolutiva para o seu agente de IA, o Computer. Mas, diferente de tudo que jÃ¡ vimos em memÃ³ria de IA, o Brain nÃ£o foi feito para lembrar de vocÃª â€” ele foi feito para lembrar do trabalho do agente.

O que Ã© o Perplexity Brain?

O Brain Ã© um sistema de memÃ³ria que constrÃ³i um grafo de contexto de todo o trabalho que o Computer realiza. Em intervalos definidos (como durante a noite), o Brain revisa esse grafo e ensina a si mesmo como fazer o trabalho melhor.

A lÃ³gica Ã© simples: quanto mais vocÃª usa, mais eficiente o Computer fica.

O Brain estÃ¡ sendo lanÃ§ado hoje para assinantes do Perplexity Max e Enterprise Max, em fase de Research Preview.

Dois eixos da memÃ³ria em IA

A Perplexity divide a memÃ³ria de IA em dois eixos: sobre o que Ã© a memÃ³ria e para que ela serve.

Tradicionalmente, a memÃ³ria de IA Ã© sobre o usuÃ¡rio â€” preferÃªncias, gostos, estilo de trabalho, contatos. Sua finalidade Ã© engajamento: fazer vocÃª se sentir mais conectado ao agente.

O Brain escolheu o caminho oposto:

DimensÃ£o	MemÃ³ria tradicional (usuÃ¡rio)	Brain (memÃ³ria de trabalho)
Sobre o que Ã©	O usuÃ¡rio	O trabalho do agente
O que lembra	PreferÃªncias, gostos, estilo, contatos	O que o agente fez, o que funcionou, o que falhou, correÃ§Ãµes
Para que serve	Sentir-se mais engajado com o agente	Ajudar o agente a fazer melhor o trabalho
O que produz	Um perfil do usuÃ¡rio	Um grafo de contexto rastreÃ¡vel do trabalho

Como o Grafo de Contexto funciona

O Brain cria um grafo de contexto vivo para o Computer. Esse grafo Ã© rastreÃ¡vel â€” cada entrada de memÃ³ria tem um link de volta para a sessÃ£o, arquivo ou fonte que a originou.

A camada de contexto assume a forma de uma wiki baseada em LLM, automaticamente carregada no sandbox do agente. Suas pÃ¡ginas refletem ideias, pessoas, projetos e outros elementos do mundo do usuÃ¡rio.

Durante a noite, o Brain sintetiza incrementalmente as sessÃµes do usuÃ¡rio, resultados de conectores, mudanÃ§as em documentos-fonte e correÃ§Ãµes feitas. Esse contexto atualizado dÃ¡ ao Computer um sinal mais forte sobre o que fazer e onde procurar.

Auto-melhoria recursiva

O Brain melhora conforme vocÃª usa o Computer. Os agentes aprendem os projetos, conectores, artefatos e preferÃªncias de como o trabalho Ã© feito. Nas palavras da Perplexity, o conjunto de dados de treinamento cresce com o uso:

“Quanto mais vocÃª usa o Computer, mais o Brain aprende com seu trabalho.”

Isso cria um ciclo de auto-melhoria recursiva: o agente fica melhor no trabalho â†’ vocÃª usa mais â†’ o agente fica ainda melhor.

ImplicaÃ§Ãµes

O Brain da Perplexity representa uma mudanÃ§a de paradigma na memÃ³ria de IA. Enquanto a maioria das empresas foca em fazer o agente te conhecer melhor, a Perplexity foca em fazer o agente trabalhar melhor.

Se essa abordagem ganhar traÃ§Ã£o, podemos ver outros assistentes de IA seguindo o mesmo caminho â€” priorizando a competÃªncia do agente sobre a personalizaÃ§Ã£o do usuÃ¡rio.

O lanÃ§amento do Brain reforÃ§a a estratÃ©gia da Perplexity de competir com gigantes como OpenAI e Google nÃ£o apenas na qualidade do modelo, mas na experiÃªncia completa do agente â€” algo que vai muito alÃ©m de respostas para perguntas.

18 de junho de 2026

Amazon Bedrock AgentCore: agentes de IA em produÃ§Ã£o com duas chamadas de API
HÃ¡ um ano, Simon Willison definiu agentes de IA com uma das descriÃ§Ãµes mais claras atÃ© hoje: “Um agente LLM executa ferramentas em loop para alcanÃ§ar um objetivo.” Essa definiÃ§Ã£o permanece atual porque descreve exatamente o que todo agente de produÃ§Ã£o faz â€” Kiro, Amazon Q Developer, Claude Code, Codex: todos executam o mesmo formato bÃ¡sico.

Mas o loop nunca foi a parte difÃcil. A parte difÃcil sempre foi tudo ao redor dele: escolher framework, configurar ferramentas, provisionar computaÃ§Ã£o isolada, configurar armazenamento, secrets, rede, decidir onde a memÃ³ria vive, adicionar observabilidade e colocar as dependÃªncias certas no container certo.

Duas chamadas de API para um agente em produÃ§Ã£o

A Amazon acaba de anunciar a disponibilidade geral (GA) do Amazon Bedrock AgentCore harness. Com apenas duas chamadas de API â€” CreateHarness para definir um agente e InvokeHarness para executÃ¡-lo â€” vocÃª tem um agente rodando em minutos. Ele funciona em seu prÃ³prio ambiente isolado com sistema de arquivos e shell, pode ler arquivos, executar comandos e escrever cÃ³digo com seguranÃ§a.

O agente lembra usuÃ¡rios e conversas entre sessÃµes, utiliza habilidades que vocÃª aponta para ele (incluindo um catÃ¡logo curado pela AWS), navega na web, chama suas ferramentas via gateway ou MCP e troca de provedor de modelo no meio da sessÃ£o sem perder contexto. Cada etapa retorna em tempo real via streaming e Ã© automaticamente rastreada no Amazon CloudWatch.

Troca de modelos sem perda de contexto

Uma das funcionalidades mais solicitadas: escolha um modelo padrÃ£o no CreateHarness e depois substitua-o em qualquer chamada InvokeHarness. Diferentes tarefas precisam de modelos diferentes â€” planejar com um modelo e executar com outro, trocar de provedor para teste de custo-performance, ou migrar de um modelo que acabou de sofrer uma regressÃ£o.

E a parte mais importante: troque de provedor a qualquer momento, mesmo no meio da sessÃ£o, e mantenha o contexto. Use Claude Opus para planejar, mude para GPT-5.5 para escrever cÃ³digo, alterne para Gemini para resumir. A conversa continua. O harness gerencia a transiÃ§Ã£o de forma transparente.

Ferramentas declarativas e habilidades

Ferramentas sÃ£o como o agente afeta qualquer coisa fora de seu raciocÃnio, e conectÃ¡-las Ã© a parte que a maioria das equipes detesta. No AgentCore, ferramentas sÃ£o uma lista declarativa no CreateHarness:
- agentcore_browser: navegaÃ§Ã£o web integrada
- agentcore_code_interpreter: execuÃ§Ã£o de cÃ³digo em sandbox
- remote_mcp: ferramentas via protocolo MCP
- agentcore_gateway: gateway de ferramentas da AWS
As mesmas opÃ§Ãµes estÃ£o disponÃveis no InvokeHarness para ediÃ§Ãµes por chamada, permitindo restringir ferramentas para uma invocaÃ§Ã£o especÃfica.

MemÃ³ria gerenciada automaticamente

Na GA, omitir a configuraÃ§Ã£o de memÃ³ria no CreateHarness provisiona automaticamente uma memÃ³ria gerenciada com padrÃµes sensatos: estratÃ©gias SEMANTIC + SUMMARIZATION, expiraÃ§Ã£o de eventos em 30 dias, criptografia gerenciada pela AWS e isolamento multi-tenant. A memÃ³ria gerenciada Ã© automÃ¡tica, mas nÃ£o Ã© uma caixa preta â€” Ã© um recurso AWS real e endereÃ§Ã¡vel que vocÃª pode consultar, anexar a outro agente, auditar ou enviar para um pipeline de anÃ¡lise.

O que isso significa

O AgentCore harness elimina o trabalho pesado de infraestrutura que historicamente consumia semanas ou meses das equipes de engenharia. O gargalo para agentes de IA em produÃ§Ã£o nunca foi a inteligÃªncia â€” era a orquestraÃ§Ã£o e a infraestrutura. Com essa abordagem, a Amazon estÃ¡ apostando que o futuro dos agentes estÃ¡ em tornar a implantaÃ§Ã£o trivial, para que as equipes possam se concentrar no que realmente importa: o que o agente faz, e nÃ£o como ele roda.
18 de junho de 2026
EUA criam via rÃ¡pida para conectar data centers de IA Ã rede elÃ©trica

A ComissÃ£o Federal de RegulaÃ§Ã£o de Energia dos EUA (FERC) ordenou que operadoras de rede elÃ©trica deem prioridade mÃ¡xima aos pedidos de conexÃ£o de data centers de IA e outros grandes consumidores de eletricidade. A decisÃ£o unÃ¢nime, anunciada na quinta-feira, cria uma “via rÃ¡pida” regulatÃ³ria para conectar data centers Ã rede elÃ©trica.

Sob as novas ordens, seis grandes operadoras de rede precisam demonstrar que os data centers conseguem “se conectar ao sistema de transmissÃ£o de forma oportuna e ordenada”. Os data centers serÃ£o responsÃ¡veis por pagar os custos da interconexÃ£o.

Tecnologias alternativas

A FERC tambÃ©m abriu uma porta para startups de tecnologia de rede, orientando as operadoras a considerar “tecnologias de transmissÃ£o alternativas”. Embora a comissÃ£o nÃ£o tenha especificado tecnologias, a diretiva pode incluir inovaÃ§Ãµes como transformadores de estado sÃ³lido e linhas de transmissÃ£o supercondutoras.

As operadoras tÃªm 30 dias para enviar um relatÃ³rio detalhando quanta capacidade de geraÃ§Ã£o tÃªm disponÃvel â€” se Ã© que tÃªm alguma. Em 60 dias, precisam “defender ou revisar” as tarifas de eletricidade em suas regiÃµes.

O problema nÃ£o resolvido: geraÃ§Ã£o de energia

Embora as diretrizes da FERC deem aos data centers uma via rÃ¡pida para se conectar, elas nÃ£o abordam a escassez de capacidade de geraÃ§Ã£o de eletricidade. As conexÃµes Ã rede tÃªm sido lentas em parte porque novas usinas de energia tambÃ©m enfrentam problemas para se conectar.

No final de 2023, os pedidos de conexÃ£o de usinas de energia excediam a capacidade total da frota existente â€” ou seja, a fila para entrar na rede era maior que a prÃ³pria rede.

Nesse contexto, espera-se que a demanda de eletricidade dos data centers quase triplique atÃ© 2035. As operadoras de rede, acostumadas com crescimento de demanda quase zero nas Ãºltimas duas dÃ©cadas, estÃ£o sob pressÃ£o. Algumas, como a PJM (maior operadora dos EUA), entraram em conflitos internos sobre a melhor forma de cobrar grandes usuÃ¡rios.

PreÃ§os de energia disparam

Empresas de tecnologia e desenvolvedores, incapazes de se conectar Ã rede em tempo hÃ¡bil, tÃªm recorrido Ã geraÃ§Ã£o local (atrÃ¡s do medidor), que Ã© tipicamente mais cara e complexa.

Ainda assim, projetos suficientes conseguiram se conectar a ponto de os preÃ§os de eletricidade dispararem em muitas regiÃµes. As tarifas de eletricidade no atacado aumentaram atÃ© 267% em comparaÃ§Ã£o com cinco anos atrÃ¡s, segundo a Bloomberg.

A FERC foi pressionada a agir pelo SecretÃ¡rio de Energia Chris Wright, que em outubro disse que os atrasos nas conexÃµes de data centers ameaÃ§avam minar a competitividade dos EUA em IA. Desde entÃ£o, o sentimento pÃºblico em relaÃ§Ã£o Ã IA e data centers azedou consideravelmente.

Enquanto isso, o governo Trump anunciou na quarta-feira que pagarÃ¡ US$ 765 milhÃµes Ã desenvolvedora eÃ³lica Invenergy para cancelar arrendamentos eÃ³licos offshore perto da CalifÃ³rnia, Maine e Nova York. A empresa usarÃ¡ o dinheiro para construir usinas de gÃ¡s natural no Centro-Oeste e projetos geotÃ©rmicos no Oeste. No total, o governo jÃ¡ gastou cerca de US$ 2,6 bilhÃµes para cancelar projetos de energia eÃ³lica offshore â€” enquanto tenta acelerar a infraestrutura de IA.

18 de junho de 2026
Amazon vai vender chips de IA Trainium para desafiar o domÃnio da Nvidia

A Amazon Web Services estÃ¡ prestes a desafiar a Nvidia de forma mais agressiva do que nunca. Segundo a Bloomberg, o diretor de IA da empresa, Peter DeSantis, revelou que a AWS estÃ¡ em conversas para vender seus chips de IA Trainium para outras empresas utilizarem em seus prÃ³prios data centers â€” uma mudanÃ§a estratÃ©gica monumental.

AtÃ© agora, a AWS resistia a vender seus chips diretamente. O modelo de negÃ³cio era indireto: os clientes usavam os chips Trainium na nuvem da AWS, e a empresa lucrava nÃ£o apenas com os tokens de IA processados, mas com um ecossistema completo de serviÃ§os â€” armazenamento, seguranÃ§a, redes e monitoramento. Agora, a Amazon quer entrar diretamente no mercado de hardware de IA.

Um mercado de US$ 50 bilhÃµes

Na carta anual aos acionistas em abril, o CEO Andy Jassy afirmou que os chips de IA da empresa sÃ£o tÃ£o cobiÃ§ados que ele estava considerando vendÃª-los a terceiros:

“Se nosso negÃ³cio de chips fosse independente, e vendesse chips produzidos este ano para a AWS e outros terceiros (como outras empresas lÃderes de chips fazem), nossa receita anual seria de aproximadamente US$ 50 bilhÃµes. HÃ¡ tanta demanda por nossos chips que Ã© bem possÃvel que vendamos racks deles para terceiros no futuro.”

Um competidor de US$ 50 bilhÃµes nÃ£o derrubaria a Nvidia â€” que atualmente tem uma receita anual de US$ 326 bilhÃµes â€”, mas Ã© um valor comparÃ¡vel Ã receita anual da Intel.

Capacidade esgotada

O desafio da Amazon Ã© a produÃ§Ã£o. Na mesma carta, Jassy revelou que a capacidade atual dos chips Trainium esgotou quase instantaneamente â€” e a capacidade do prÃ³ximo modelo, Trainium4, que sÃ³ estarÃ¡ disponÃvel em mais de um ano, tambÃ©m jÃ¡ estÃ¡ completamente reservada. Isso foi antes mesmo da AWS adicionar a OpenAI formalmente aos modelos que atende.

Vender chips para terceiros significa potencialmente deixar clientes atuais em lista de espera, a menos que a Amazon consiga um aumento milagroso na produÃ§Ã£o com parceiros como a TSMC â€” onde a Nvidia recentemente ultrapassou a Apple como maior cliente.

A guerra dos chips de IA

O porta-voz da AWS, Doron Aronson, confirmou: “Embora historicamente tenhamos recusado pedidos para vender chips diretamente, Andy observou que Ã© bem possÃvel que vendamos racks deles para terceiros no futuro.”

Enquanto Jensen Huang, CEO da Nvidia, declarou recentemente ter encontrado um novo mercado de US$ 200 bilhÃµes vendendo CPUs para IA (entrando no territÃ³rio da Intel e AMD), Jassy claramente tem suas prÃ³prias ambiÃ§Ãµes: um mercado de US$ 50 bilhÃµes que colocaria a Amazon mais diretamente no mundo da Nvidia.

A batalha pelo domÃnio do hardware de IA estÃ¡ apenas comeÃ§ando.

18 de junho de 2026
Amazon Investiga e AmeaÃ§a Demitir FuncionÃ¡rios que Defenderam RegulamentaÃ§Ã£o de Data Centers em Seattle

TrÃªs engenheiros de software da Amazon acusam a empresa de retaliaÃ§Ã£o apÃ³s testemunharem em audiÃªncias do Conselho Municipal de Seattle a favor da regulamentaÃ§Ã£o de data centers. Os funcionÃ¡rios dizem que a Amazon abriu investigaÃ§Ãµes internas que podem levar Ã demissÃ£o â€” violando uma lei municipal que proÃbe discriminaÃ§Ã£o por posicionamento polÃtico.

No dia 10 de junho â€” uma semana apÃ³s a audiÃªncia e um dia depois que o Conselho aprovou uma moratÃ³ria histÃ³rica para data centers â€” Patrick Schloesser, Darius Irani e Liesl Wigand foram chamados para reuniÃµes de emergÃªncia com o RH da Amazon. Representantes de “RelaÃ§Ãµes com FuncionÃ¡rios” disseram que a empresa estava investigando os trÃªs, com possÃveis medidas disciplinares que incluem demissÃ£o.

“Eu nÃ£o vou aceitar uma realidade em que a Amazon ou qualquer corporaÃ§Ã£o possa me silenciar no exercÃcio dos meus direitos”, disse Schloesser ao The Verge. “NÃ£o vamos voltar para a linha.”

AECJ e a luta por data centers sustentÃ¡veis

Os cinco funcionÃ¡rios que testemunharam â€” incluindo Schloesser, Irani e Wigand â€” sÃ£o membros do Amazon Employees for Climate Justice (AECJ), grupo de funcionÃ¡rios dedicados Ã crise climÃ¡tica. No ano passado, o grupo publicou uma carta aberta assinada por mais de mil funcionÃ¡rios pedindo que a Amazon alimentasse seus data centers com energia 100% renovÃ¡vel.

Schloesser relatou que a reuniÃ£o com o RH foi “arrepiante”: o representante perguntou detalhes sobre seu depoimento no Conselho e citou a polÃtica de comunicaÃ§Ãµes corporativas da Amazon, que proÃbe atuar como porta-voz sem aprovaÃ§Ã£o prÃ©via. Mas Schloesser se identificou apenas pelo cargo e associaÃ§Ã£o ao AECJ, nunca como representante oficial da Amazon.

Irani contou que se sentiu “abalado e inseguro” apÃ³s a reuniÃ£o. “Tudo que eu fiz foi compartilhar minha opiniÃ£o de que IA e data centers deveriam ser regulamentados”, afirmou.

CenÃ¡rio nacional de tensÃ£o

A controvÃ©rsia em Seattle reflete uma tensÃ£o nacional. Nos Ãºltimos meses, a construÃ§Ã£o massiva de data centers gerou protestos em todo o paÃs â€” por consumo de Ã¡gua, poluiÃ§Ã£o sonora, aumento das tarifas de energia elÃ©trica e impacto ambiental.

Pouco antes da moratÃ³ria, quatro empresas desconhecidas haviam protocolado propostas para cinco data centers de grande escala em Seattle. Juntos, eles consumiriam o equivalente a um terÃ§o da eletricidade mÃ©dia diÃ¡ria da cidade â€” dez vezes mais que todos os data centers atuais.

Na quinta-feira, os trÃªs engenheiros protocolaram uma queixa formal no EscritÃ³rio de Direitos Civis de Seattle, pedindo investigaÃ§Ã£o sobre discriminaÃ§Ã£o trabalhista pela Amazon. Abby Lawlor, advogada do AECJ, destacou que Seattle Ã© uma das poucas jurisdiÃ§Ãµes nos EUA que proÃbe discriminaÃ§Ã£o de funcionÃ¡rios por crenÃ§as polÃticas â€” exatamente o que a Amazon estaria violando.

“Trabalhadores de tecnologia precisam poder falar e agir de acordo com suas convicÃ§Ãµes para que CEOs nÃ£o possam atropelar todos nÃ³s para conseguir o que querem”, declarou Eliza Pan, porta-voz do AECJ. “A Amazon nÃ£o pode intimidar seus funcionÃ¡rios â€” e todos nÃ³s deverÃamos nos preocupar se eles conseguirem.”

18 de junho de 2026
Trabalhadores de Tecnologia Criam Super PAC de US$ 5 MilhÃµes para Enfrentar o Lobby BilionÃ¡rio das Big Techs por RegulamentaÃ§Ã£o da IA

Um movimento de base estÃ¡ surgindo entre trabalhadores do setor de tecnologia que exigem que suas empresas desenvolvam e implantem IA de forma responsÃ¡vel. A Guardrails Alliance, um novo super PAC dedicado a apoiar legislaÃ§Ã£o de IA, quer canalizar essa insatisfaÃ§Ã£o.

As estrategistas democratas Shaunna Thomas e Leah Hunt-Hendrix lanÃ§aram a Guardrails Alliance na quinta-feira com apoio de funcionÃ¡rios de tecnologia, sindicatos e outros grupos.

“A nossa crenÃ§a fundamental Ã© que as pessoas ainda tÃªm o poder de impedir essa tomada autocrÃ¡tica da administraÃ§Ã£o Trump e do setor de tecnologia”, disse Thomas ao The New York Times.

US$ 5 milhÃµes contra US$ 100 milhÃµes

A Guardrails se posiciona como um movimento polÃtico populista que funciona com pequenas doaÃ§Ãµes de pessoas que estÃ£o na linha de frente do boom da IA. O PAC tem cerca de US$ 5 milhÃµes Ã disposiÃ§Ã£o e planeja arrecadar US$ 15 milhÃµes neste ciclo â€” valor modesto comparado aos US$ 100 milhÃµes da Leading the Future, super PAC apoiado por lÃderes como Greg Brockman, presidente da OpenAI.

O primeiro alvo da Guardrails serÃ¡ apoiar Alex Bores, candidato ao congresso por Nova York que se tornou o primeiro alvo da Leading the Future. Bores compartilhou um anÃºncio com os pais de Adam Raine, o adolescente que morreu por suicÃdio apÃ³s meses de conversas prolongadas com o ChatGPT.

Trabalhadores se mobilizam

Enquanto a OpenAI tenta se distanciar das doaÃ§Ãµes de Brockman, vÃ¡rios funcionÃ¡rios estÃ£o insatisfeitos e manifestaram preocupaÃ§Ãµes nas redes sociais sobre os ataques a Bores.

Neste ano, trabalhadores de tecnologia tambÃ©m se mobilizaram para exigir que suas empresas encerrassem contratos com o ICE (agÃªncia de imigraÃ§Ã£o dos EUA) e pediram que o PentÃ¡gono retirasse a designaÃ§Ã£o da Anthropic como risco Ã cadeia de suprimentos â€” rÃ³tulo que crÃticos dizem ter sido imposto como retaliaÃ§Ã£o pelos limites que a Anthropic impÃ´s ao uso de sua tecnologia para vigilÃ¢ncia em massa e guerra autÃ´noma.

“NÃ£o se trata de competir dÃ³lar por dÃ³lar com a Leading the Future”, disse Thomas. “Este veÃculo foi criado para ser uma casa polÃtica para pessoas preocupadas com a maneira como o setor de tecnologia anti-regulamentaÃ§Ã£o estÃ¡ tentando manipular eleiÃ§Ãµes.”

A Guardrails Alliance representa uma nova frente na batalha pela regulamentaÃ§Ã£o da IA nos EUA, mostrando que os prÃ³prios trabalhadores do setor estÃ£o se organizando para contrapor o lobby bilionÃ¡rio das big techs.

18 de junho de 2026
General Intuition Levanta US$ 300 MilhÃµes com AvaliaÃ§Ã£o de US$ 2 BilhÃµes para Criar Agentes de IA com CompreensÃ£o Espacial

A General Intuition, startup sediada em Nova York que constrÃ³i modelos de fundaÃ§Ã£o para treinar agentes de IA a se moverem no espaÃ§o e no tempo, estÃ¡ em negociaÃ§Ãµes para levantar cerca de US$ 300 milhÃµes, segundo fontes familiarizadas com o assunto revelaram ao TechCrunch.

A rodada acontece apenas oito meses depois que a General Intuition se desmembrou da Medal â€” plataforma de compartilhamento de clipes de games â€” com uma rodada seed de US$ 134 milhÃµes. Os novos recursos elevariam a avaliaÃ§Ã£o da startup para pouco mais de US$ 2 bilhÃµes.

Entre os investidores estÃ£o nomes de peso como Jeff Bezos e Eric Schmidt, alÃ©m dos investidores existentes Khosla Ventures e General Catalyst.

Dataset Ãºnico com 2 bilhÃµes de vÃdeos por ano

A General Intuition foi fundada por Pim de Witte (cofundador da Medal) ao lado dos pesquisadores Eloi Alonso, Adam Jelley e Vincent Micheli â€” especialistas em modelagem de mundo e simulaÃ§Ã£o.

A startup treina modelos de IA incorporada (embodied AI) e modelos de mundo usando o dataset da Medal, que captura 2 bilhÃµes de vÃdeos por ano de 10 milhÃµes de usuÃ¡rios ativos mensais. O diferencial: por serem vÃdeos de gameplay em primeira pessoa, o dataset permite que a IA aprenda raciocÃnio espaÃ§o-temporal profundo â€” percebendo, antecipando e interagindo em tempo real dentro de simulaÃ§Ãµes.

Corrida pelos modelos de mundo

O segmento de world models estÃ¡ aquecido. Startups como Runway, Decart e World Labs lanÃ§aram modelos de mundo recentemente, enquanto o Genie 3 do Google comeÃ§ou a integrar dados do Google Maps para simulaÃ§Ãµes mais realistas.

A diferenÃ§a da General Intuition: ela constrÃ³i modelos de mundo para treinar agentes, nÃ£o para vendÃª-los. Os agentes sÃ£o o produto final, e o dataset exclusivo da Medal dÃ¡ Ã startup um caminho claro para viabilidade comercial.

A empresa deve usar os novos recursos para escalar sua capacidade computacional e lanÃ§ar um novo produto atÃ© o final do verÃ£o americano ou inÃcio do outono.

Com nomes como Bezos e Schmidt apostando pesado em agentes de IA com compreensÃ£o espacial, a General Intuition se posiciona como uma das startups mais promissoras na interseÃ§Ã£o entre games, simulaÃ§Ã£o e inteligÃªncia artificial.

18 de junho de 2026