Blog

  • AWS SageMaker ganha mais de 100 métricas detalhadas para inferência de IA generativa

    AWS SageMaker ganha mais de 100 métricas detalhadas para inferência de IA generativa

    A Amazon Web Services (AWS) anunciou um salto significativo na observabilidade de endpoints de inferência de IA generativa no Amazon SageMaker AI. A plataforma agora emite mais de 100 métricas detalhadas de inferência, com um dashboard integrado no Amazon CloudWatch que elimina a necessidade de configurações manuais de Grafana e Prometheus.

    O desafio da inferência em escala

    Monitorar e solucionar problemas em endpoints de IA generativa operando em escala é um dos maiores desafios das equipes de MLOps atualmente. Quando a latência P99 de um endpoint de LLM aumenta, a equipe precisa determinar em minutos se a causa raiz é pressão de memória da GPU, saturação do cache KV, tráfego desbalanceado entre Zonas de Disponibilidade ou uma política de auto scaling que não foi acionada.

    A mudança do treinamento para o serving está transformando como as equipes implantam LLMs e outros modelos de IA generativa em produção. Engenheiros de plataforma de ML, times de MLOps e SREs precisam manter endpoints de inferência saudáveis, responsivos e com custo eficiente — frequentemente gerenciando dezenas de modelos e centenas de instâncias de GPU.

    Métricas detalhadas: o que há de novo

    As novas métricas cobrem áreas críticas que antes exigiam instrumentação customizada:

    • Saúde da GPU: utilização por acelerador, temperatura, consumo de energia
    • Latência em nível de token: Time to First Token (TTFT) e Inter-Token Latency (ITL)
    • Pressão do cache KV: saturação e taxa de acerto/erro
    • Distribuição de tráfego: balanceamento entre Zonas de Disponibilidade
    • Posicionamento de componentes de inferência: distribuição de inference components
    • Diagnóstico de cold start: tempo de inicialização e aquecimento de modelos

    As métricas são emitidas nativamente em formato OpenTelemetry e podem ser consultadas via PromQL, permitindo integração com ferramentas externas como Grafana e Datadog para quem já possui stacks de observabilidade estabelecidas.

    Dashboard SageMaker Insights

    O SageMaker Insights está localizado no console do CloudWatch em Infrastructure Monitoring → SageMaker Insights. O dashboard é organizado em três abas:

    • Performance: saúde da frota, latência de tokens, throughput, erros e pressão do motor de inferência
    • Capacity: utilização de GPU, CPU e memória da frota
    • Reliability: distribuição por Zona de Disponibilidade, eventos de scaling, anatomia de cold starts e erros de capacidade insuficiente

    O dashboard suporta tanto Single-Model Endpoints (SME) quanto Inference Component (IC) Endpoints — a arquitetura recomendada para cargas de trabalho de IA generativa em produção por permitir hospedagem multi-modelo em infraestrutura de GPU compartilhada.

    Como ativar

    As métricas detalhadas podem ser ativadas em endpoints novos (automático por padrão) ou em endpoints existentes via configuração. Para métricas em nível de token (TTFT e ITL), é necessário usar containers vLLM ou SGLang.

    Este lançamento representa um passo importante para tornar a inferência de IA generativa mais operacional e confiável em ambientes de produção, reduzindo o tempo de diagnóstico de horas para minutos.

  • Elastic adquire startup de IA DeductiveAI por até US$ 85 milhões

    Elastic adquire startup de IA DeductiveAI por até US$ 85 milhões

    A Elastic, empresa conhecida pelo Elasticsearch, concordou em adquirir a startup de IA DeductiveAI por até US$ 85 milhões, segundo uma fonte com conhecimento direto do acordo.

    Fundada em 2023, a DeductiveAI saiu do stealth em novembro do ano passado, quando anunciou uma rodada seed de US$ 7,5 milhões liderada pela CRV, com participação da Databricks Ventures, Thomvest Ventures e PrimeSet. O investimento avaliou a startup em US$ 33 milhões, de acordo com o PitchBook.

    A aquisição marca uma saída rápida para a DeductiveAI, que opera em um setor de rápido crescimento conhecido como AI SRE (Site Reliability Engineering com IA). Ferramentas de SRE com IA se tornaram essenciais diante do enorme volume de código gerado por inteligência artificial. Substituir a depuração manual por IA permite que engenheiros de SRE se concentrem mais em desenvolvimento de produto do que em apagar incêndios constantemente.

    Tendência de aquisições de startups de IA

    A aquisição reflete uma tendência mais ampla: grandes empresas de tecnologia estabelecidas estão comprando startups nativas de IA para integrar tecnologias baseadas em agentes em suas suítes de produtos existentes.

    A Elastic, que abriu capital em 2018, é mais conhecida pelo Elasticsearch, o mecanismo de busca e análise que ajuda organizações a armazenar, pesquisar, analisar e monitorar grandes volumes de dados em tempo quase real. Seu software de observabilidade pode se beneficiar significativamente da tecnologia da DeductiveAI.

    Segundo a fonte, integrar a tecnologia de IA da DeductiveAI à Elastic permitirá que os clientes monitorem automaticamente o desempenho e resolvam falhas de sistema em tempo real.

    Competição no setor

    A DeductiveAI foi cofundada por Rakesh Kothari, anteriormente VP de engenharia da ThoughtSpot, e Sameer Agarwal, ex-Apache Software Foundation e Meta, que também foi um dos engenheiros fundadores da Databricks.

    Embora a DeductiveAI tenha alcançado aproximadamente US$ 1 milhão em receita recorrente anual (ARR), seu crescimento ficou atrás da Resolve AI, uma das líderes do setor. A Resolve, fundada há dois anos pelo ex-executivo da Splunk Spiros Xanthos, foi avaliada em US$ 1,5 bilhão em abril, quando levantou uma extensão de Série A de US$ 40 milhões.

    O acordo demonstra o apetite contínuo do mercado por soluções de IA aplicadas a operações de TI e confiabilidade de sistemas — um nicho que deve crescer à medida que mais código gerado por IA chega à produção.

  • Casa Branca cria regras de IA em tempo real enquanto Anthropic enfrenta restrições sem precedentes

    Casa Branca cria regras de IA em tempo real enquanto Anthropic enfrenta restrições sem precedentes

    Casa Branca cria regras de IA em tempo real enquanto Anthropic enfrenta restrições sem precedentes

    O governo Trump está criando as regras para inteligência artificial na hora, sem estrutura regulatória clara, e a Anthropic é a primeira grande vítima desse improviso. A empresa não pode distribuir seus modelos mais avançados — Claude Mythos e Fable 5 — após entrar em conflito com o governo, mas ninguém consegue explicar exatamente o que a companhia fez de errado.

    Ao longo de toda essa crise, a Anthropic insiste que não violou nenhum procedimento ou regra concreta estabelecida pelo governo. Mas a Casa Branca sustenta que a empresa agiu de forma imprudente, demonstrando que não se pode confiar nela para lançar tecnologia de fronteira com segurança.

    Regulação no improviso

    “O problema é que a Casa Branca esteve em uma postura extrema anti-regulatória e agora se depara com capacidades reais de IA que as pessoas preveem há anos”, diz um ex-funcionário de tecnologia da Casa Branca, que pediu anonimato. “Deveria ter havido preparação e políticas para lidar com isso sistematicamente, gerenciando benefícios e riscos. Em vez disso, é essa abordagem improvisada que coloca a indústria de IA em um dilema real.”

    A administração Trump bloqueou repetidamente esforços para impor barreiras de segurança à indústria de IA, argumentando que as regras poderiam prejudicar a inovação americana e fazer o país perder terreno para rivais como a China. O presidente assinou ordens executivas que reverteram iniciativas da era Biden para criar um marco nacional de IA e criou uma força-tarefa federal para contestar leis estaduais consideradas onerosas.

    O que a Anthropic supostamente fez

    A disputa é marcada pela opacidade. Em nenhum momento o governo dos EUA declarou claramente o que a Anthropic fez de errado — o melhor que temos é um post no X descrevendo a situação geral, feito pelo conselheiro de tecnologia da Casa Branca David Sacks.

    Segundo reportagens do WIRED, autoridades americanas se preocuparam quando souberam, no início deste mês, que a Anthropic compartilhou o Mythos com a SK Telecom, gigante sul-coreana de telecomunicações que supostamente tem laços com a China. Em outro caso, o CEO da Amazon, Andy Jassy, levantou preocupações com o secretário do Tesouro Scott Bessent de que algumas barreiras de segurança do Claude Fable 5 poderiam ser contornadas.

    A Anthropic diz que coordenou com o governo dos EUA o lançamento do Mythos — o que significa que as autoridades poderiam ter levantado o alerta sobre a SK Telecom antecipadamente. A empresa trabalha com a companhia coreana há anos, e o arranjo nunca havia causado problemas de segurança nacional antes. Quando a Casa Branca manifestou preocupação, a Anthropic revogou o acesso imediatamente.

    Consequências severas

    Ironicamente, as ações da Casa Branca provavelmente prejudicaram exatamente o tipo de inovação que o governo diz querer proteger. A administração Trump exigiu que a Anthropic proibisse todos os estrangeiros de acessar Mythos e Fable 5, impedindo que muitos dos próprios funcionários da empresa — e todos os seus clientes, incluindo Apple, Meta e grande parte da Fortune 500 — acessassem seus modelos mais avançados.

    O precedente para outras big techs

    Outros laboratórios de IA como OpenAI, Google e Meta estão observando a situação da Anthropic com atenção. Muitos líderes de IA estão chegando à mesma conclusão: precisarão dar à Casa Branca acesso antecipado a seus modelos mais recentes e ser extremamente proativos em compartilhar informações sobre lançamentos futuros. O risco de pegar as autoridades desprevenidas é simplesmente grande demais.

    O problema central não é que o governo dos EUA esteja tentando garantir que modelos avançados de IA tenham salvaguardas adequadas. É que a administração Trump agora se vê forçada a tomar decisões regulatórias em tempo real, sem estrutura, sem regras claras e sem precedentes.

    Enquanto isso, o setor inteiro prende a respiração.

    Fonte: WIRED

  • Baseten levanta US$ 1,5 bilhão e valuation salta para US$ 13 bilhões em apenas 5 meses

    Baseten levanta US$ 1,5 bilhão e valuation salta para US$ 13 bilhões em apenas 5 meses

    Baseten levanta US$ 1,5 bilhão e valuation salta para US$ 13 bilhões em apenas 5 meses

    A startup de inferência de IA Baseten está prestes a fechar uma rodada de financiamento impressionante de US$ 1,5 bilhão, avaliando a empresa em US$ 13 bilhões, segundo informações do Wall Street Journal.

    O que torna esse número ainda mais surpreendente é o intervalo entre as rodadas. Há apenas cinco meses, em janeiro de 2026, a Baseten anunciou uma Série E de US$ 300 milhões com valuation de US$ 5 bilhões. E essa rodada veio apenas nove meses depois de uma Série D de US$ 150 milhões.

    Se confirmada, esta nova rodada representa um aumento de 160% no valuation em menos de seis meses — um ritmo quase sem precedentes mesmo no frenético mercado de IA.

    Split-priced round: valuation turbinado artificialmente?

    O WSJ revela que a rodada utiliza uma estrutura de split-priced round, tática que startups estão adotando para inflar o valuation principal e fazer os investidores-líderes parecerem mais bem-sucedidos no papel. Alguns investidores entram com valuation de US$ 13 bilhões, enquanto outros aportam com valuation de US$ 11 bilhões.

    A rodada é co-liderada por Spark Capital, Sands Capital, Altimeter Capital e Wellington Management.

    A corrida do ouro da inferência

    A Baseten compete no mercado de inferência de IA como serviço — permitindo que empresas executem modelos de linguagem de grande escala (LLMs) em produção sem gerenciar infraestrutura própria. Com a explosão de agentes de IA, RAG (geração aumentada por recuperação) e aplicações que exigem latência baixíssima, a demanda por plataformas de inferência dedicadas disparou.

    Concorrentes como Together AI, Fireworks AI e Groq também captaram centenas de milhões nos últimos meses, confirmando que Wall Street e o venture capital enxergam a inferência como a próxima grande frente de infraestrutura de IA — depois da corrida pelos chips e data centers.

    O frenesi de investimentos levanta questões sobre sustentabilidade. Com valuations dobrando a cada semestre, a pressão por receita proporcional será enorme quando essas startups eventualmente abrirem capital ou enfrentarem um mercado menos generoso.

    Fonte: TechCrunch e Wall Street Journal

  • OpenAI Contrata Noam Shazeer, Coautor dos Transformers, e Ex-Assessor da Casa Branca na Preparação para o IPO

    OpenAI Contrata Noam Shazeer, Coautor dos Transformers, e Ex-Assessor da Casa Branca na Preparação para o IPO

    A OpenAI está montando um time de peso para sua estreia no mercado público. A empresa anunciou a contratação de duas figuras de alto escalão: Noam Shazeer, lenda do Google DeepMind e coautor do paper que criou os Transformers, e Dean Ball, ex-assessor de política de IA da Casa Branca no governo Trump.

    Noam Shazeer: o pai dos Transformers

    Shazeer é um dos nomes mais importantes da IA generativa moderna. Ele é coautor do artigo seminal de 2017 “Attention Is All You Need”, que introduziu a arquitetura Transformer — a base de modelos como GPT, Gemini, Claude e praticamente todos os LLMs atuais.

    Ele passou quase toda a carreira no Google (desde 2000), com uma pausa de três anos para fundar a startup de role-playing com IA Character AI. Em um movimento que chamou atenção do mercado, o Google recontratou Shazeer em 2023 num acordo de US$ 2,7 bilhões que deu à big tech acesso à tecnologia da startup.

    Sua saída do Google para a OpenAI é mais um capítulo na intensa guerra de talentos entre os principais laboratórios de IA — Google, OpenAI, Anthropic e Meta.

    Shazeer também se envolveu em controvérsias internas no Google. Segundo o The Information, ele expressou opiniões em fóruns internos sobre identidade transgênero e a guerra em Gaza que levaram a gestão a deletar suas postagens. Resta saber se essas polêmicas o acompanharão na nova casa.

    Dean Ball e o time de “Futuros Estratégicos”

    Ball teve uma passagem rápida mas impactante pela Casa Branca, onde ajudou a publicar o America’s AI Action Plan. Depois, voltou ao think tank tecno-libertário Foundation for American Innovation como senior fellow.

    Na OpenAI, Ball liderará um novo time chamado Strategic Futures (Futuros Estratégicos), reportando diretamente ao Chief Strategy Officer Jason Kwon.

    Nas palavras de Ball, o mandato do time será:

    “Ajudar a liderança da empresa a moldar a política de IA de fronteira.”

    O time — descrito como “pequeno e de alta agência” — focará em riscos catastróficos, auto-melhoria recursiva, impacto no mercado de trabalho e a relação entre laboratórios de fronteira, governos e sociedade.

    Ball destacou um ponto crucial: governança interna será mais central para o futuro da IA do que a maioria imagina. “Quase por necessidade, os laboratórios de IA terão que liderar as decisões de governança de IA”, escreveu.

    O contexto do IPO

    As contratações acontecem num momento estratégico. A OpenAI se prepara para um dos IPOs mais aguardados do setor de tecnologia, e ter nomes como Shazeer (credibilidade técnica) e Ball (credibilidade regulatória) no time envia um sinal claro ao mercado.

    Shazeer traz o peso acadêmico e técnico. Ball traz a ponte com Washington — algo cada vez mais crítico conforme a regulação de IA avança nos EUA e no mundo.

    A dança das cadeiras entre os grandes laboratórios de IA está longe de terminar. Mas uma coisa é certa: a OpenAI está se armando com alguns dos nomes mais influentes do setor para o que promete ser uma das maiores estreias na bolsa dos próximos anos.

  • Perplexity Lança Brain: Sistema de Memória Auto-Evolutiva que Constrói Grafo de Contexto do Trabalho do Agente

    Perplexity Lança Brain: Sistema de Memória Auto-Evolutiva que Constrói Grafo de Contexto do Trabalho do Agente

    A Perplexity acaba de lançar o Brain, um sistema de memória auto-evolutiva para o seu agente de IA, o Computer. Mas, diferente de tudo que já vimos em memória de IA, o Brain não foi feito para lembrar de você — ele foi feito para lembrar do trabalho do agente.

    O que é o Perplexity Brain?

    O Brain é um sistema de memória que constrói um grafo de contexto de todo o trabalho que o Computer realiza. Em intervalos definidos (como durante a noite), o Brain revisa esse grafo e ensina a si mesmo como fazer o trabalho melhor.

    A lógica é simples: quanto mais você usa, mais eficiente o Computer fica.

    O Brain está sendo lançado hoje para assinantes do Perplexity Max e Enterprise Max, em fase de Research Preview.

    Dois eixos da memória em IA

    A Perplexity divide a memória de IA em dois eixos: sobre o que é a memória e para que ela serve.

    Tradicionalmente, a memória de IA é sobre o usuário — preferências, gostos, estilo de trabalho, contatos. Sua finalidade é engajamento: fazer você se sentir mais conectado ao agente.

    O Brain escolheu o caminho oposto:

    Dimensão Memória tradicional (usuário) Brain (memória de trabalho)
    Sobre o que é O usuário O trabalho do agente
    O que lembra Preferências, gostos, estilo, contatos O que o agente fez, o que funcionou, o que falhou, correções
    Para que serve Sentir-se mais engajado com o agente Ajudar o agente a fazer melhor o trabalho
    O que produz Um perfil do usuário Um grafo de contexto rastreável do trabalho

    Como o Grafo de Contexto funciona

    O Brain cria um grafo de contexto vivo para o Computer. Esse grafo é rastreável — cada entrada de memória tem um link de volta para a sessão, arquivo ou fonte que a originou.

    A camada de contexto assume a forma de uma wiki baseada em LLM, automaticamente carregada no sandbox do agente. Suas páginas refletem ideias, pessoas, projetos e outros elementos do mundo do usuário.

    Durante a noite, o Brain sintetiza incrementalmente as sessões do usuário, resultados de conectores, mudanças em documentos-fonte e correções feitas. Esse contexto atualizado dá ao Computer um sinal mais forte sobre o que fazer e onde procurar.

    Auto-melhoria recursiva

    O Brain melhora conforme você usa o Computer. Os agentes aprendem os projetos, conectores, artefatos e preferências de como o trabalho é feito. Nas palavras da Perplexity, o conjunto de dados de treinamento cresce com o uso:

    “Quanto mais você usa o Computer, mais o Brain aprende com seu trabalho.”

    Isso cria um ciclo de auto-melhoria recursiva: o agente fica melhor no trabalho → você usa mais → o agente fica ainda melhor.

    Implicações

    O Brain da Perplexity representa uma mudança de paradigma na memória de IA. Enquanto a maioria das empresas foca em fazer o agente te conhecer melhor, a Perplexity foca em fazer o agente trabalhar melhor.

    Se essa abordagem ganhar tração, podemos ver outros assistentes de IA seguindo o mesmo caminho — priorizando a competência do agente sobre a personalização do usuário.

    O lançamento do Brain reforça a estratégia da Perplexity de competir com gigantes como OpenAI e Google não apenas na qualidade do modelo, mas na experiência completa do agente — algo que vai muito além de respostas para perguntas.

  • Amazon Bedrock AgentCore: agentes de IA em produção com duas chamadas de API

    Amazon Bedrock AgentCore: agentes de IA em produção com duas chamadas de API

    Há um ano, Simon Willison definiu agentes de IA com uma das descrições mais claras até hoje: “Um agente LLM executa ferramentas em loop para alcançar um objetivo.” Essa definição permanece atual porque descreve exatamente o que todo agente de produção faz — Kiro, Amazon Q Developer, Claude Code, Codex: todos executam o mesmo formato básico.

    Mas o loop nunca foi a parte difícil. A parte difícil sempre foi tudo ao redor dele: escolher framework, configurar ferramentas, provisionar computação isolada, configurar armazenamento, secrets, rede, decidir onde a memória vive, adicionar observabilidade e colocar as dependências certas no container certo.

    Duas chamadas de API para um agente em produção

    A Amazon acaba de anunciar a disponibilidade geral (GA) do Amazon Bedrock AgentCore harness. Com apenas duas chamadas de API — CreateHarness para definir um agente e InvokeHarness para executá-lo — você tem um agente rodando em minutos. Ele funciona em seu próprio ambiente isolado com sistema de arquivos e shell, pode ler arquivos, executar comandos e escrever código com segurança.

    O agente lembra usuários e conversas entre sessões, utiliza habilidades que você aponta para ele (incluindo um catálogo curado pela AWS), navega na web, chama suas ferramentas via gateway ou MCP e troca de provedor de modelo no meio da sessão sem perder contexto. Cada etapa retorna em tempo real via streaming e é automaticamente rastreada no Amazon CloudWatch.

    Troca de modelos sem perda de contexto

    Uma das funcionalidades mais solicitadas: escolha um modelo padrão no CreateHarness e depois substitua-o em qualquer chamada InvokeHarness. Diferentes tarefas precisam de modelos diferentes — planejar com um modelo e executar com outro, trocar de provedor para teste de custo-performance, ou migrar de um modelo que acabou de sofrer uma regressão.

    E a parte mais importante: troque de provedor a qualquer momento, mesmo no meio da sessão, e mantenha o contexto. Use Claude Opus para planejar, mude para GPT-5.5 para escrever código, alterne para Gemini para resumir. A conversa continua. O harness gerencia a transição de forma transparente.

    Ferramentas declarativas e habilidades

    Ferramentas são como o agente afeta qualquer coisa fora de seu raciocínio, e conectá-las é a parte que a maioria das equipes detesta. No AgentCore, ferramentas são uma lista declarativa no CreateHarness:

    • agentcore_browser: navegação web integrada
    • agentcore_code_interpreter: execução de código em sandbox
    • remote_mcp: ferramentas via protocolo MCP
    • agentcore_gateway: gateway de ferramentas da AWS

    As mesmas opções estão disponíveis no InvokeHarness para edições por chamada, permitindo restringir ferramentas para uma invocação específica.

    Memória gerenciada automaticamente

    Na GA, omitir a configuração de memória no CreateHarness provisiona automaticamente uma memória gerenciada com padrões sensatos: estratégias SEMANTIC + SUMMARIZATION, expiração de eventos em 30 dias, criptografia gerenciada pela AWS e isolamento multi-tenant. A memória gerenciada é automática, mas não é uma caixa preta — é um recurso AWS real e endereçável que você pode consultar, anexar a outro agente, auditar ou enviar para um pipeline de análise.

    O que isso significa

    O AgentCore harness elimina o trabalho pesado de infraestrutura que historicamente consumia semanas ou meses das equipes de engenharia. O gargalo para agentes de IA em produção nunca foi a inteligência — era a orquestração e a infraestrutura. Com essa abordagem, a Amazon está apostando que o futuro dos agentes está em tornar a implantação trivial, para que as equipes possam se concentrar no que realmente importa: o que o agente faz, e não como ele roda.

  • EUA criam via rápida para conectar data centers de IA à rede elétrica

    EUA criam via rápida para conectar data centers de IA à rede elétrica

    A Comissão Federal de Regulação de Energia dos EUA (FERC) ordenou que operadoras de rede elétrica deem prioridade máxima aos pedidos de conexão de data centers de IA e outros grandes consumidores de eletricidade. A decisão unânime, anunciada na quinta-feira, cria uma “via rápida” regulatória para conectar data centers à rede elétrica.

    Sob as novas ordens, seis grandes operadoras de rede precisam demonstrar que os data centers conseguem “se conectar ao sistema de transmissão de forma oportuna e ordenada”. Os data centers serão responsáveis por pagar os custos da interconexão.

    Tecnologias alternativas

    A FERC também abriu uma porta para startups de tecnologia de rede, orientando as operadoras a considerar “tecnologias de transmissão alternativas”. Embora a comissão não tenha especificado tecnologias, a diretiva pode incluir inovações como transformadores de estado sólido e linhas de transmissão supercondutoras.

    As operadoras têm 30 dias para enviar um relatório detalhando quanta capacidade de geração têm disponível — se é que têm alguma. Em 60 dias, precisam “defender ou revisar” as tarifas de eletricidade em suas regiões.

    O problema não resolvido: geração de energia

    Embora as diretrizes da FERC deem aos data centers uma via rápida para se conectar, elas não abordam a escassez de capacidade de geração de eletricidade. As conexões à rede têm sido lentas em parte porque novas usinas de energia também enfrentam problemas para se conectar.

    No final de 2023, os pedidos de conexão de usinas de energia excediam a capacidade total da frota existente — ou seja, a fila para entrar na rede era maior que a própria rede.

    Nesse contexto, espera-se que a demanda de eletricidade dos data centers quase triplique até 2035. As operadoras de rede, acostumadas com crescimento de demanda quase zero nas últimas duas décadas, estão sob pressão. Algumas, como a PJM (maior operadora dos EUA), entraram em conflitos internos sobre a melhor forma de cobrar grandes usuários.

    Preços de energia disparam

    Empresas de tecnologia e desenvolvedores, incapazes de se conectar à rede em tempo hábil, têm recorrido à geração local (atrás do medidor), que é tipicamente mais cara e complexa.

    Ainda assim, projetos suficientes conseguiram se conectar a ponto de os preços de eletricidade dispararem em muitas regiões. As tarifas de eletricidade no atacado aumentaram até 267% em comparação com cinco anos atrás, segundo a Bloomberg.

    A FERC foi pressionada a agir pelo Secretário de Energia Chris Wright, que em outubro disse que os atrasos nas conexões de data centers ameaçavam minar a competitividade dos EUA em IA. Desde então, o sentimento público em relação à IA e data centers azedou consideravelmente.

    Enquanto isso, o governo Trump anunciou na quarta-feira que pagará US$ 765 milhões à desenvolvedora eólica Invenergy para cancelar arrendamentos eólicos offshore perto da Califórnia, Maine e Nova York. A empresa usará o dinheiro para construir usinas de gás natural no Centro-Oeste e projetos geotérmicos no Oeste. No total, o governo já gastou cerca de US$ 2,6 bilhões para cancelar projetos de energia eólica offshore — enquanto tenta acelerar a infraestrutura de IA.

  • Amazon vai vender chips de IA Trainium para desafiar o domínio da Nvidia

    Amazon vai vender chips de IA Trainium para desafiar o domínio da Nvidia

    A Amazon Web Services está prestes a desafiar a Nvidia de forma mais agressiva do que nunca. Segundo a Bloomberg, o diretor de IA da empresa, Peter DeSantis, revelou que a AWS está em conversas para vender seus chips de IA Trainium para outras empresas utilizarem em seus próprios data centers — uma mudança estratégica monumental.

    Até agora, a AWS resistia a vender seus chips diretamente. O modelo de negócio era indireto: os clientes usavam os chips Trainium na nuvem da AWS, e a empresa lucrava não apenas com os tokens de IA processados, mas com um ecossistema completo de serviços — armazenamento, segurança, redes e monitoramento. Agora, a Amazon quer entrar diretamente no mercado de hardware de IA.

    Um mercado de US$ 50 bilhões

    Na carta anual aos acionistas em abril, o CEO Andy Jassy afirmou que os chips de IA da empresa são tão cobiçados que ele estava considerando vendê-los a terceiros:

    “Se nosso negócio de chips fosse independente, e vendesse chips produzidos este ano para a AWS e outros terceiros (como outras empresas líderes de chips fazem), nossa receita anual seria de aproximadamente US$ 50 bilhões. Há tanta demanda por nossos chips que é bem possível que vendamos racks deles para terceiros no futuro.”

    Um competidor de US$ 50 bilhões não derrubaria a Nvidia — que atualmente tem uma receita anual de US$ 326 bilhões —, mas é um valor comparável à receita anual da Intel.

    Capacidade esgotada

    O desafio da Amazon é a produção. Na mesma carta, Jassy revelou que a capacidade atual dos chips Trainium esgotou quase instantaneamente — e a capacidade do próximo modelo, Trainium4, que só estará disponível em mais de um ano, também já está completamente reservada. Isso foi antes mesmo da AWS adicionar a OpenAI formalmente aos modelos que atende.

    Vender chips para terceiros significa potencialmente deixar clientes atuais em lista de espera, a menos que a Amazon consiga um aumento milagroso na produção com parceiros como a TSMC — onde a Nvidia recentemente ultrapassou a Apple como maior cliente.

    A guerra dos chips de IA

    O porta-voz da AWS, Doron Aronson, confirmou: “Embora historicamente tenhamos recusado pedidos para vender chips diretamente, Andy observou que é bem possível que vendamos racks deles para terceiros no futuro.”

    Enquanto Jensen Huang, CEO da Nvidia, declarou recentemente ter encontrado um novo mercado de US$ 200 bilhões vendendo CPUs para IA (entrando no território da Intel e AMD), Jassy claramente tem suas próprias ambições: um mercado de US$ 50 bilhões que colocaria a Amazon mais diretamente no mundo da Nvidia.

    A batalha pelo domínio do hardware de IA está apenas começando.

  • Amazon Investiga e Ameaça Demitir Funcionários que Defenderam Regulamentação de Data Centers em Seattle

    Amazon Investiga e Ameaça Demitir Funcionários que Defenderam Regulamentação de Data Centers em Seattle

    Amazon Investiga e Ameaça Demitir Funcionários que Defenderam Regulamentação de Data Centers em Seattle

    Três engenheiros de software da Amazon acusam a empresa de retaliação após testemunharem em audiências do Conselho Municipal de Seattle a favor da regulamentação de data centers. Os funcionários dizem que a Amazon abriu investigações internas que podem levar à demissão — violando uma lei municipal que proíbe discriminação por posicionamento político.

    No dia 10 de junho — uma semana após a audiência e um dia depois que o Conselho aprovou uma moratória histórica para data centers — Patrick Schloesser, Darius Irani e Liesl Wigand foram chamados para reuniões de emergência com o RH da Amazon. Representantes de “Relações com Funcionários” disseram que a empresa estava investigando os três, com possíveis medidas disciplinares que incluem demissão.

    “Eu não vou aceitar uma realidade em que a Amazon ou qualquer corporação possa me silenciar no exercício dos meus direitos”, disse Schloesser ao The Verge. “Não vamos voltar para a linha.”

    AECJ e a luta por data centers sustentáveis

    Os cinco funcionários que testemunharam — incluindo Schloesser, Irani e Wigand — são membros do Amazon Employees for Climate Justice (AECJ), grupo de funcionários dedicados à crise climática. No ano passado, o grupo publicou uma carta aberta assinada por mais de mil funcionários pedindo que a Amazon alimentasse seus data centers com energia 100% renovável.

    Schloesser relatou que a reunião com o RH foi “arrepiante”: o representante perguntou detalhes sobre seu depoimento no Conselho e citou a política de comunicações corporativas da Amazon, que proíbe atuar como porta-voz sem aprovação prévia. Mas Schloesser se identificou apenas pelo cargo e associação ao AECJ, nunca como representante oficial da Amazon.

    Irani contou que se sentiu “abalado e inseguro” após a reunião. “Tudo que eu fiz foi compartilhar minha opinião de que IA e data centers deveriam ser regulamentados”, afirmou.

    Cenário nacional de tensão

    A controvérsia em Seattle reflete uma tensão nacional. Nos últimos meses, a construção massiva de data centers gerou protestos em todo o país — por consumo de água, poluição sonora, aumento das tarifas de energia elétrica e impacto ambiental.

    Pouco antes da moratória, quatro empresas desconhecidas haviam protocolado propostas para cinco data centers de grande escala em Seattle. Juntos, eles consumiriam o equivalente a um terço da eletricidade média diária da cidade — dez vezes mais que todos os data centers atuais.

    Na quinta-feira, os três engenheiros protocolaram uma queixa formal no Escritório de Direitos Civis de Seattle, pedindo investigação sobre discriminação trabalhista pela Amazon. Abby Lawlor, advogada do AECJ, destacou que Seattle é uma das poucas jurisdições nos EUA que proíbe discriminação de funcionários por crenças políticas — exatamente o que a Amazon estaria violando.

    “Trabalhadores de tecnologia precisam poder falar e agir de acordo com suas convicções para que CEOs não possam atropelar todos nós para conseguir o que querem”, declarou Eliza Pan, porta-voz do AECJ. “A Amazon não pode intimidar seus funcionários — e todos nós deveríamos nos preocupar se eles conseguirem.”

  • Trabalhadores de Tecnologia Criam Super PAC de US$ 5 Milhões para Enfrentar o Lobby Bilionário das Big Techs por Regulamentação da IA

    Trabalhadores de Tecnologia Criam Super PAC de US$ 5 Milhões para Enfrentar o Lobby Bilionário das Big Techs por Regulamentação da IA

    Trabalhadores de Tecnologia Criam Super PAC de US$ 5 Milhões para Enfrentar o Lobby Bilionário das Big Techs por Regulamentação da IA

    Um movimento de base está surgindo entre trabalhadores do setor de tecnologia que exigem que suas empresas desenvolvam e implantem IA de forma responsável. A Guardrails Alliance, um novo super PAC dedicado a apoiar legislação de IA, quer canalizar essa insatisfação.

    As estrategistas democratas Shaunna Thomas e Leah Hunt-Hendrix lançaram a Guardrails Alliance na quinta-feira com apoio de funcionários de tecnologia, sindicatos e outros grupos.

    “A nossa crença fundamental é que as pessoas ainda têm o poder de impedir essa tomada autocrática da administração Trump e do setor de tecnologia”, disse Thomas ao The New York Times.

    US$ 5 milhões contra US$ 100 milhões

    A Guardrails se posiciona como um movimento político populista que funciona com pequenas doações de pessoas que estão na linha de frente do boom da IA. O PAC tem cerca de US$ 5 milhões à disposição e planeja arrecadar US$ 15 milhões neste ciclo — valor modesto comparado aos US$ 100 milhões da Leading the Future, super PAC apoiado por líderes como Greg Brockman, presidente da OpenAI.

    O primeiro alvo da Guardrails será apoiar Alex Bores, candidato ao congresso por Nova York que se tornou o primeiro alvo da Leading the Future. Bores compartilhou um anúncio com os pais de Adam Raine, o adolescente que morreu por suicídio após meses de conversas prolongadas com o ChatGPT.

    Trabalhadores se mobilizam

    Enquanto a OpenAI tenta se distanciar das doações de Brockman, vários funcionários estão insatisfeitos e manifestaram preocupações nas redes sociais sobre os ataques a Bores.

    Neste ano, trabalhadores de tecnologia também se mobilizaram para exigir que suas empresas encerrassem contratos com o ICE (agência de imigração dos EUA) e pediram que o Pentágono retirasse a designação da Anthropic como risco à cadeia de suprimentos — rótulo que críticos dizem ter sido imposto como retaliação pelos limites que a Anthropic impôs ao uso de sua tecnologia para vigilância em massa e guerra autônoma.

    “Não se trata de competir dólar por dólar com a Leading the Future”, disse Thomas. “Este veículo foi criado para ser uma casa política para pessoas preocupadas com a maneira como o setor de tecnologia anti-regulamentação está tentando manipular eleições.”

    A Guardrails Alliance representa uma nova frente na batalha pela regulamentação da IA nos EUA, mostrando que os próprios trabalhadores do setor estão se organizando para contrapor o lobby bilionário das big techs.

  • General Intuition Levanta US$ 300 Milhões com Avaliação de US$ 2 Bilhões para Criar Agentes de IA com Compreensão Espacial

    General Intuition Levanta US$ 300 Milhões com Avaliação de US$ 2 Bilhões para Criar Agentes de IA com Compreensão Espacial

    General Intuition Levanta US$ 300 Milhões com Avaliação de US$ 2 Bilhões para Criar Agentes de IA com Compreensão Espacial

    A General Intuition, startup sediada em Nova York que constrói modelos de fundação para treinar agentes de IA a se moverem no espaço e no tempo, está em negociações para levantar cerca de US$ 300 milhões, segundo fontes familiarizadas com o assunto revelaram ao TechCrunch.

    A rodada acontece apenas oito meses depois que a General Intuition se desmembrou da Medal — plataforma de compartilhamento de clipes de games — com uma rodada seed de US$ 134 milhões. Os novos recursos elevariam a avaliação da startup para pouco mais de US$ 2 bilhões.

    Entre os investidores estão nomes de peso como Jeff Bezos e Eric Schmidt, além dos investidores existentes Khosla Ventures e General Catalyst.

    Dataset único com 2 bilhões de vídeos por ano

    A General Intuition foi fundada por Pim de Witte (cofundador da Medal) ao lado dos pesquisadores Eloi Alonso, Adam Jelley e Vincent Micheli — especialistas em modelagem de mundo e simulação.

    A startup treina modelos de IA incorporada (embodied AI) e modelos de mundo usando o dataset da Medal, que captura 2 bilhões de vídeos por ano de 10 milhões de usuários ativos mensais. O diferencial: por serem vídeos de gameplay em primeira pessoa, o dataset permite que a IA aprenda raciocínio espaço-temporal profundo — percebendo, antecipando e interagindo em tempo real dentro de simulações.

    Corrida pelos modelos de mundo

    O segmento de world models está aquecido. Startups como Runway, Decart e World Labs lançaram modelos de mundo recentemente, enquanto o Genie 3 do Google começou a integrar dados do Google Maps para simulações mais realistas.

    A diferença da General Intuition: ela constrói modelos de mundo para treinar agentes, não para vendê-los. Os agentes são o produto final, e o dataset exclusivo da Medal dá à startup um caminho claro para viabilidade comercial.

    A empresa deve usar os novos recursos para escalar sua capacidade computacional e lançar um novo produto até o final do verão americano ou início do outono.

    Com nomes como Bezos e Schmidt apostando pesado em agentes de IA com compreensão espacial, a General Intuition se posiciona como uma das startups mais promissoras na interseção entre games, simulação e inteligência artificial.