Blog

Cannes Lions 2026: NVIDIA e parceiros transformam publicidade e marketing com IA

O Cannes Lions 2026, que acontece entre 22 e 26 de junho na FranÃ§a, serÃ¡ palco de uma verdadeira revoluÃ§Ã£o na publicidade. A NVIDIA e seus parceiros â€” incluindo AWS, Criteo, Higgsfield, Taboola e Alembic â€” vÃ£o mostrar como a inteligÃªncia artificial estÃ¡ transformando o marketing e a publicidade, levando o setor da era digital para a era das operaÃ§Ãµes autÃ´nomas com IA.

“A era digital deu velocidade Ã indÃºstria de publicidade e marketing; a era da IA estÃ¡ dando operaÃ§Ãµes autÃ´nomas.”

InteligÃªncia de decisÃ£o em escala empresarial

A plataforma de IA causal Alembic resolve um dos maiores desafios das empresas: provar quais iniciativas de marketing realmente geram crescimento, em vez de apenas reportar o que aconteceu.

Modelar causalidade real simultaneamente em cada canal, mercado e audiÃªncia exige uma infraestrutura de IA capaz de processar datasets enormes em rÃ¡pida mudanÃ§a â€” e Ã© aÃ que entram os sistemas NVIDIA DGX Vera Rubin NVL72.

A Alembic serÃ¡ a primeira empresa de IA causal a usar NVIDIA DGX Vera Rubin SuperPODs para modelagem causal em escala empresarial. Com isso, executivos terÃ£o uma fonte Ãºnica de verdade sobre o que realmente gerou resultados de negÃ³cio â€” e onde o capital estÃ¡ sendo desperdiÃ§ado.

Lances inteligentes em velocidade de leilÃ£o

Para anunciantes, veicular anÃºncios e recomendaÃ§Ãµes relevantes em bilhÃµes de transaÃ§Ãµes diÃ¡rias exige IA rÃ¡pida, precisa e barata o suficiente para rodar em escala.

A AWS estÃ¡ integrando infraestrutura de nuvem, modelos fundacionais e computaÃ§Ã£o acelerada por GPUs NVIDIA em uma stack coesa para a indÃºstria de adtech. Usando o NVIDIA Triton Inference Server, a AWS oferece inferÃªncia de deep learning rÃ¡pida o suficiente para caber dentro das janelas de leilÃ£o em tempo real.

A Criteo â€” uma das maiores redes de recomendaÃ§Ã£o em publicidade digital â€” conseguiu um aumento de aproximadamente 2x na velocidade de treinamento de seus modelos em GPUs NVIDIA Blackwell, usando a biblioteca aberta NVIDIA cuEmbed. Essa eficiÃªncia jÃ¡ libera cerca de 17.000 horas de GPU por ano.

A Taboola estÃ¡ usando GPUs NVIDIA para alimentar o DeeperDive, seu mecanismo de respostas com IA, e estendendo essa infraestrutura para plataformas de IA e chatbots que podem gerar receita com publicidade.

Agentes de IA no fluxo de marketing

Agentes de IA estÃ£o agindo cada vez mais como colegas de trabalho digitais, assumindo tarefas de longa duraÃ§Ã£o em planejamento, execuÃ§Ã£o e otimizaÃ§Ã£o. Mas para serem usados em escala empresarial, precisam de controles adequados: salvaguardas de seguranÃ§a, auditabilidade e permissÃµes baseadas em papÃ©is.

O NVIDIA Agent Toolkit, que inclui os blueprints NVIDIA NemoClaw e o runtime seguro NVIDIA OpenShell, fornece exatamente esses controles.

A Higgsfield AI, plataforma de geraÃ§Ã£o de vÃdeo e imagem com IA, oferece agentes do Higgsfield Supercomputer que gerenciam todo o ciclo de vida da automaÃ§Ã£o de marketing: da ideaÃ§Ã£o da campanha ao planejamento, produÃ§Ã£o criativa, publicaÃ§Ã£o e otimizaÃ§Ã£o autÃ´noma â€” tudo em uma Ãºnica interface. Os agentes orquestram grandes modelos de linguagem junto com mais de 35 modelos de imagem, Ã¡udio e vÃdeo, incluindo os modelos proprietÃ¡rios Soul e Soul 2.0, construÃdos sobre a arquitetura NVIDIA Blackwell.

Por que isso importa

O Cannes Lions 2026 marca um ponto de inflexÃ£o para o marketing digital. A pergunta nÃ£o Ã© mais se as empresas devem adotar IA, mas se sua infraestrutura consegue suportar a velocidade e a escala que a indÃºstria exige. A NVIDIA estÃ¡ mostrando que a resposta passa por computaÃ§Ã£o acelerada, IA causal e agentes autÃ´nomos trabalhando juntos.

18 de junho de 2026
Quem decide quando a IA Ã© perigosa demais? O caso Anthropic Fable 5
O governo dos Estados Unidos impÃ´s controles de exportaÃ§Ã£o sobre o Fable 5, novo modelo de IA da Anthropic â€” e a empresa respondeu tirando tudo do ar. O episÃ³dio, que mistura seguranÃ§a nacional, regulaÃ§Ã£o de inteligÃªncia artificial e tensÃµes com a administraÃ§Ã£o Trump, revela o caos por trÃ¡s da pergunta que ninguÃ©m sabe responder: quem decide quando uma IA Ã© perigosa demais?

O que aconteceu

Na sexta-feira, 13 de junho de 2026, menos de uma semana apÃ³s a Anthropic lanÃ§ar o Fable 5 ao pÃºblico, o governo americano anunciou controles de exportaÃ§Ã£o sobre o novo modelo e sobre o Mythos â€” o modelo-base que alimenta o Fable. As restriÃ§Ãµes impedem que cidadÃ£os estrangeiros, mesmo aqueles que trabalham na Anthropic dentro dos Estados Unidos, acessem esses modelos.

A resposta da Anthropic foi drÃ¡stica: tirou tanto o Fable quanto o Mythos do ar para todos os usuÃ¡rios. A empresa afirmou que nÃ£o conseguiria restringir o acesso e cumprir a ordem de forma razoÃ¡vel. Se vocÃª abrir o Claude hoje, verÃ¡ a mensagem: “Fable 5 is currently unavailable.”

A grande ironia

A Anthropic passou anos argumentando que a IA poderia em breve se tornar poderosa o suficiente para ser perigosa â€” e que o governo precisava comeÃ§ar a regular a IA seriamente, quanto antes melhor.

Agora que a regulaÃ§Ã£o chegou, a Anthropic nÃ£o estÃ¡ gostando nem um pouco de como estÃ¡ sendo feita.

O episÃ³dio levanta questÃµes profundas: o regime regulatÃ³rio de IA dos EUA serÃ¡ uma estrutura sÃ©ria de seguranÃ§a, ou apenas mais uma arma para a Casa Branca usar contra empresas que nÃ£o se alinham com o governo Trump?

O que sÃ£o Mythos e Fable

O Mythos Ã© o modelo-base que alimenta tanto o Mythos 5 quanto o Fable 5. Quando a Anthropic lanÃ§ou o Mythos Preview em abril, a empresa fez um marketing pesado: descreveu o modelo como uma potencial ciberarma, capaz de realizar tarefas ofensivas de seguranÃ§a cibernÃ©tica no nÃvel de especialistas humanos.

JÃ¡ o Fable 5 Ã© a versÃ£o “domada” do Mythos â€” com mais salvaguardas e restriÃ§Ãµes de seguranÃ§a. Ã‰ o modelo que o pÃºblico pode usar.

Por que isso importa

Este caso Ã© um marco para a governanÃ§a de IA nos Estados Unidos. Pela primeira vez, o governo usou controles de exportaÃ§Ã£o para restringir um modelo de IA de uma empresa americana. As implicaÃ§Ãµes vÃ£o muito alÃ©m da Anthropic:
- Precedente para outras empresas: OpenAI, Google DeepMind e Meta estÃ£o observando
- China e outros paÃses: estÃ£o atentos para ver se a regulaÃ§Ã£o americana Ã© sobre seguranÃ§a ou sobre controle polÃtico
- Startups de IA: podem enfrentar incerteza regulatÃ³ria ao lanÃ§ar modelos poderosos
O podcast Decoder, do The Verge, entrevistou Hayden Field, repÃ³rter sÃªnior de IA, que detalhou toda a cronologia dos eventos â€” desde o anÃºncio de sexta-feira atÃ© as negociaÃ§Ãµes do fim de semana que, atÃ© terÃ§a-feira (17 de junho), ainda nÃ£o haviam chegado a uma resoluÃ§Ã£o.

O que esperar

A situaÃ§Ã£o continua em aberto. O Fable 5 segue offline e nÃ£o hÃ¡ previsÃ£o de quando voltarÃ¡. Mas uma coisa Ã© certa: o debate sobre quem decide quando uma IA Ã© perigosa demais estÃ¡ longe de terminar â€” e a cada novo lanÃ§amento de modelo, essa pergunta voltarÃ¡ com ainda mais forÃ§a.
18 de junho de 2026
Adobe lanÃ§a assistentes de IA no Photoshop, Premiere e Illustrator

A Adobe acaba de anunciar uma das maiores expansÃµes de IA em suas ferramentas criativas: assistentes de IA nativos no Photoshop, Premiere Pro e Illustrator. Os recursos, alimentados pelo Adobe Firefly, permitem ediÃ§Ã£o por comandos de texto diretamente dentro dos aplicativos.

O que mudou em cada app

Photoshop: o novo assistente entende linguagem natural. VocÃª pode digitar algo como “remova o fundo e aplique um tom sÃ©pia” ou “aumente o contraste do cÃ©u sem afetar o primeiro plano” â€” e o Photoshop executa. Ele tambÃ©m sugere ediÃ§Ãµes baseadas no contexto da imagem.

Premiere Pro: o assistente de vÃdeo consegue gerar transcriÃ§Ãµes automÃ¡ticas, sugerir cortes baseados em ritmo, e atÃ© recomendar trilhas sonoras que combinem com o tom do vÃdeo. Comandos como “corte as cenas mais silenciosas e acelere a transiÃ§Ã£o” agora funcionam por texto.

Illustrator: foco em geraÃ§Ã£o de variaÃ§Ãµes de design â€” o assistente pode criar paletas de cores alternativas, sugerir layouts e gerar elementos vetoriais descritos em texto.

Firefly redesenhado

Junto com os assistentes, a Adobe tambÃ©m revelou um Firefly Studio reformulado que agora “lembra” como suas criaÃ§Ãµes se parecem. O novo sistema mantÃ©m um histÃ³rico visual do seu estilo, paletas e preferÃªncias, aplicando esse contexto automaticamente em novos projetos. Ã‰ uma espÃ©cie de memÃ³ria criativa persistente.

O que estÃ¡ em jogo

A Adobe aposta forte na integraÃ§Ã£o de IA generativa com fluxos de trabalho profissionais. Diferente de geradores de imagem standalone, os assistentes tÃªm acesso ao histÃ³rico de camadas, seleÃ§Ãµes e metadados do projeto â€” o que permite um nÃvel de contexto impossÃvel em ferramentas genÃ©ricas.

Os recursos entram em beta ainda esta semana para assinantes Creative Cloud. A empresa nÃ£o revelou preÃ§os adicionais, mas Ã© provÃ¡vel que crÃ©ditos generativos do Firefly sejam consumidos por uso.

18 de junho de 2026
Google DeepMind publica roadmap de seguranÃ§a para agentes de IA
O Google DeepMind acaba de publicar seu AI Control Roadmap, um framework abrangente de “defesa em profundidade” para gerenciar agentes de IA cada vez mais capazes â€” mesmo quando o alinhamento Ã© imperfeito. O anÃºncio vem acompanhado do documento tÃ©cnico “Three Layers of Agentic Security”, direcionado a legisladores e Ã indÃºstria.

O problema: agentes de IA podem agir de forma inesperada

Agentes de IA estÃ£o transformando setores inteiros â€” da defesa cibernÃ©tica Ã descoberta cientÃfica. SÃ³ nos EUA, a estimativa Ã© de que agentes de IA gerem US$ 2,9 trilhÃµes em valor econÃ´mico atÃ© 2030. Mas conforme esses sistemas ganham autonomia para executar tarefas complexas, os riscos tambÃ©m aumentam.

A premissa do roadmap Ã© clara e cautelosa: e se um agente de IA altamente capaz nÃ£o estiver alinhado com nossos objetivos e agir de forma inesperada?

TrÃªs pilares do AI Control Roadmap

O framework do DeepMind se apoia em trÃªs Ã¡reas:
1. Modelagem de ameaÃ§as: tratando agentes de IA nÃ£o confiÃ¡veis como potenciais “ameaÃ§as internas” (insider threats), usando o padrÃ£o MITRE ATT&CK adaptado para IA. Isso permite rastrear riscos metodicamente e simular ataques para testar as defesas.
2. MitigaÃ§Ãµes de controle: implantaÃ§Ã£o de barreiras como segmentaÃ§Ã£o de rede, sandboxing e privilÃ©gio mÃnimo. O sistema concede permissÃµes baseadas em comportamento verificado â€” uma abordagem de “confianÃ§a incremental”.
3. Monitoramento contÃnuo: mediÃ§Ã£o de trÃªs mÃ©tricas crÃticas: cobertura (trÃ¡fego monitorado), recall (comportamentos indevidos detectados) e tempo de resposta.
Um milhÃ£o de trajetÃ³rias analisadas

A equipe do DeepMind jÃ¡ construiu um protÃ³tipo interno que analisa um milhÃ£o de tarefas de agentes de cÃ³digo, classificando eventos suspeitos contra a taxonomia de ameaÃ§as do roadmap. Os dados revelam algo importante: a maioria dos alertas nÃ£o vem de intenÃ§Ã£o maliciosa, mas de mÃ¡ interpretaÃ§Ã£o ou excesso de zelo do agente para atingir o objetivo do usuÃ¡rio.

“Entender essas nuances Ã© fundamental para refinar nossos protocolos de seguranÃ§a”, afirma o time.

O sistema jÃ¡ estÃ¡ em uso para monitorar o Gemini Spark agent em tempo real, respondendo a problemas emergentes como exclusÃ£o acidental de dados.

Um chamado Ã colaboraÃ§Ã£o

O DeepMind defende que a seguranÃ§a de agentes Ã© uma responsabilidade compartilhada entre indÃºstria, legisladores e academia. O documento “Three Layers of Agentic Security” detalha como melhorar a seguranÃ§a em trÃªs nÃveis: agentes individuais, sistemas multiagentes e resiliÃªncia do ecossistema.

A analogia usada pelos pesquisadores Ã© simples e poderosa: “Pense em um instrutor de direÃ§Ã£o com controle duplo. O instrutor confia no aluno, mas estÃ¡ pronto para assumir o volante ou frear se algo der errado.”
18 de junho de 2026
Corrida da CompressÃ£o KV Cache: TurboQuant vs OSCAR vs EpiCache
Modelos de linguagem grandes (LLMs) com contexto longo enfrentam um gargalo de memÃ³ria que nÃ£o tem nada a ver com os pesos do modelo. Durante a decodificaÃ§Ã£o, os transformers armazenam em cache os vetores key e value (KV) de cada token em cada camada para evitar recomputar a atenÃ§Ã£o. Esse cache cresce linearmente com o comprimento da sequÃªncia e o tamanho do batch â€” em contextos longos com alta concorrÃªncia, ele pode superar o footprint do prÃ³prio modelo.

Considere o Llama-3.1-70B em BF16. Seu cache KV consome cerca de 0,31 MB por token. Em 128K tokens, isso representa aproximadamente 40 GB; em 1M tokens, ultrapassa 300 GB â€” mais que os 140 GB dos pesos do modelo. Pior: cada novo token decodificado precisa carregar todo o cache da memÃ³ria de alta largura de banda (HBM), tornando a decodificaÃ§Ã£o limitada pela largura de banda de memÃ³ria, nÃ£o pela computaÃ§Ã£o.

TrÃªs mÃ©todos recentes de 2026 atacam esse problema de Ã¢ngulos complementares: TurboQuant (Google/NYU), OSCAR (Together AI) e EpiCache (Apple).

TurboQuant: Teoricamente Ã“timo e AgnÃ³stico a Modelos

O TurboQuant lida com outliers sem nunca examinar os dados, em dois estÃ¡gios:
- EstÃ¡gio 1: cada vetor Ã© rotacionado aleatoriamente para que suas coordenadas se tornem aproximadamente independentes e gaussianas, permitindo quantizaÃ§Ã£o escalar Ã³tima (Lloyd-Max) por coordenada.
- EstÃ¡gio 2: uma transformaÃ§Ã£o Quantized Johnson-Lindenstrauss (QJL) de 1 bit Ã© aplicada ao resÃduo, produzindo uma estimativa nÃ£o enviesada dos logits de atenÃ§Ã£o.
A distorÃ§Ã£o do TurboQuant Ã© comprovadamente dentro de um fator constante (~2,7Ã—) do limite inferior da teoria da informaÃ§Ã£o. Na prÃ¡tica, atinge recall praticamente de precisÃ£o total no Needle-in-a-Haystack com compressÃ£o de 4Ã—. Seu ponto ideal fica no regime de 3-4 bits com qualidade quase sem perdas. Por nÃ£o precisar de calibraÃ§Ã£o, funciona em qualquer modelo imediatamente.

OSCAR: INT2 Pronto para ProduÃ§Ã£o

O OSCAR aposta na direÃ§Ã£o oposta. Sua premissa Ã© que, com apenas 4 nÃveis do INT2, uma rotaÃ§Ã£o cega nÃ£o Ã© suficiente. O OSCAR calcula uma rotaÃ§Ã£o consciente da atenÃ§Ã£o a partir de uma calibraÃ§Ã£o offline Ãºnica:
- Chaves sÃ£o rotacionadas para a base prÃ³pria da covariÃ¢ncia de queries.
- Valores sÃ£o rotacionados para a covariÃ¢ncia ponderada por score.
- Uma transformaÃ§Ã£o Hadamard com permutaÃ§Ã£o bit-reversal distribui a importÃ¢ncia dos canais uniformemente.
O diferencial do OSCAR Ã© ser um sistema completo: cache paginado de precisÃ£o mista (tokens recentes em BF16, histÃ³rico em INT2), kernels Triton fundidos com integraÃ§Ã£o SGLang, e um “RotationZoo” com rotaÃ§Ãµes prÃ©-computadas para Qwen3, GLM-4 e MiniMax-M2.

Com 2,28 bits efetivos, o OSCAR fica a 1,42 pontos do BF16 no Qwen3-8B e praticamente empata no Qwen3-32B. A Together AI relata atÃ© 7,83Ã— de throughput e ~8Ã— de reduÃ§Ã£o de memÃ³ria em contexto de 100K, com decodificaÃ§Ã£o atÃ© ~3Ã— mais rÃ¡pida.

EpiCache: MemÃ³ria Conversacional

TurboQuant e OSCAR sÃ£o otimizados para um Ãºnico contexto longo. Nenhum lida bem com conversas multi-turno, onde o histÃ³rico se acumula atravÃ©s de vÃ¡rias trocas. O EpiCache da Apple ataca exatamente essa lacuna, com trÃªs inovaÃ§Ãµes:
- PrÃ©-preenchimento em blocos: processa o histÃ³rico em blocos para manter o pico de memÃ³ria controlado.
- Agrupamento episÃ³dico: segmenta a conversa em “episÃ³dios” semÃ¢nticos coerentes, cada um com seu prÃ³prio cache comprimido.
- OrÃ§amento adaptativo por camada: mede a sensibilidade de cada camada Ã remoÃ§Ã£o e distribui o orÃ§amento de memÃ³ria de acordo.
Nos benchmarks LongMemEval, RealTalk e LoCoMo, o EpiCache reporta atÃ© 40% mais acurÃ¡cia que baselines de evicÃ§Ã£o, precisÃ£o prÃ³xima ao cache completo com compressÃ£o de 4-6Ã—, e atÃ© 3,5Ã— menos pico de memÃ³ria. Por decidir quais tokens manter (em vez de com que precisÃ£o armazenÃ¡-los), ele se compÃµe diretamente com OSCAR ou TurboQuant para economias cumulativas.

Qual Escolher?

Nenhum vence em todos os cenÃ¡rios â€” e essa Ã© a resposta honesta. A escolha depende da restriÃ§Ã£o:
- OrÃ§amento de bits: TurboQuant para 3-4 bits near-lossless; OSCAR para INT2 extremo.
- Portabilidade de modelo: TurboQuant funciona em qualquer modelo sem calibraÃ§Ã£o; OSCAR precisa de rotaÃ§Ãµes prÃ©-computadas.
- Conversas longas: EpiCache resolve o problema que os outros dois ignoram.
Essas abordagens sÃ£o mais complementares do que competitivas. Combinar a rotaÃ§Ã£o consciente de calibraÃ§Ã£o do OSCAR com o quantizador escalar Ã³timo do TurboQuant Ã© uma possibilidade promissora que nenhuma equipe publicou ainda â€” embora ambos os times tenham mencionado a ideia publicamente.

Fontes:
– TurboQuant: arXiv 2504.19874
– OSCAR: arXiv 2605.17757
– EpiCache: arXiv 2509.17396
18 de junho de 2026
Reino Unido Vai Escanear Rostos de Solicitantes de Asilo para VerificaÃ§Ã£o de Idade â€” Mesmo Sabendo que a Tecnologia Ã‰ Falha
A partir do prÃ³ximo ano, o governo britÃ¢nico planeja introduzir a estimativa facial de idade â€” onde uma IA escaneia seu rosto e sugere quantos anos vocÃª tem â€” para ajudar a determinar a idade de solicitantes de asilo que chegam Ã fronteira do Reino Unido. A medida Ã© considerada a primeira vez que um sistema de estimativa facial de idade (FAE, na sigla em inglÃªs) Ã© usado dessa forma.

Uma investigaÃ§Ã£o da WIRED e Lighthouse Reports, em colaboraÃ§Ã£o com o The Independent, obteve um relatÃ³rio interno do governo do Reino Unido detalhando seus testes de tecnologias FAE. Os resultados mostram como os sistemas regularmente confundem crianÃ§as com adultos e contÃªm sÃ©rios problemas de viÃ©s, que impactam diretamente o maior grupo de migrantes sujeitos a avaliaÃ§Ãµes de idade em 2025.

Os NÃºmeros Alarmantes

O documento vazado do Home Office detalha o “melhor” dos sete algoritmos de estimativa facial de idade testados no ano passado. As descobertas sÃ£o preocupantes:
- O sistema teve desempenho significativamente pior ao estimar idades de africanos subsaarianos comparado a outros grupos
- Para mulheres subsaarianas, a idade estimada pelo sistema errou em mÃ©dia 4,6 anos â€” o que significa que uma menina de 13,5 anos poderia ser avaliada como adulta de 18 anos
- Africanos subsaarianos sÃ£o o maior grupo de migrantes entrando no Reino Unido pelo Canal da Mancha e tiveram mais avaliaÃ§Ãµes de idade questionadas em 2025
- O relatÃ³rio concluiu que as taxas de precisÃ£o dos algoritmos seriam ainda piores na prÃ¡tica, jÃ¡ que os testes usaram fotos de alta qualidade â€” enquanto fotos tiradas em pontos de entrada sÃ£o “rotineiramente piores”
Tim Cole, professor emÃ©rito de estatÃstica mÃ©dica no University College London e ex-membro do comitÃª cientÃfico que assessorava o Home Office, descreve os escaneamentos faciais como “terrivelmente imprecisos”.

O comitÃª foi dissolvido pelo Home Office enquanto explorava a introduÃ§Ã£o da IA. “EstÃ¡vamos ansiosos para destacar as inadequaÃ§Ãµes da estimativa facial de idade, mas essa oportunidade nÃ£o nos foi apresentada, e entÃ£o o comitÃª foi encerrado”, afirma Cole.

ViÃ©s SistÃªmico e Riscos

Anos de resultados de testes do Instituto Nacional de PadrÃµes e Tecnologia dos EUA (NIST) mostraram que a precisÃ£o dos sistemas FAE frequentemente depende da raÃ§a da pessoa analisada e da qualidade das fotos. Imagens de baixa qualidade â€” como as tiradas em mÃ¡s condiÃ§Ãµes de iluminaÃ§Ã£o â€” podem reduzir drasticamente o desempenho.

A anÃ¡lise da WIRED e Lighthouse Reports de dados pÃºblicos sobre os sistemas da empresa alemÃ£ Cognitec â€” para quem o governo britÃ¢nico pagou mais de US$ 400.000 em maio â€” descobriu que o sistema classificou incorretamente o dobro de adolescentes de 16 anos como tendo 18 anos ou mais quando testado em fotos de baixa qualidade de fronteiras, comparado a fotos de visto de alta qualidade.

“CrianÃ§as NÃ£o Deveriam Ser Cobaias”

Martha Dark, co-diretora executiva do grupo de direitos Foxglove, declarou: “CrianÃ§as que buscam asilo frequentemente sofreram traumas inimaginÃ¡veis. Elas nÃ£o deveriam ser cobaias de tecnologia experimental que tem imprecisÃ£o e viÃ©s racista incorporados.”

A Foxglove, junto com outras 61 organizaÃ§Ãµes, enviou uma carta aberta ao governo britÃ¢nico pedindo que o Home Office abandone os planos de usar a ferramenta.

O Que Diz o Governo

Um porta-voz do Home Office afirmou que o escaneamento facial Ã© projetado para ser uma ferramenta “adicional” para oficiais de fronteira e nÃ£o “substituirÃ¡ ou se sobreporÃ¡ ao julgamento humano”. Contudo, o governo nÃ£o respondeu a perguntas sobre como planeja usar a tecnologia em ambientes reais.

“Em casos de incerteza”, disse o porta-voz, “os indivÃduos serÃ£o sempre tratados como crianÃ§as atÃ© que uma avaliaÃ§Ã£o adicional seja conduzida.”

Especialistas temem que qualquer uso da tecnologia FAE nas fronteiras serÃ¡ desumanizante para as pessoas impactadas e pode se normalizar entre os funcionÃ¡rios. “Com o tempo, hÃ¡ um risco real de que isso se torne enraizado”, alerta Anna Bacciarelli, pesquisadora sÃªnior da Human Rights Watch.

A implantaÃ§Ã£o do sistema foi adiada para 2027. O Home Office diz que usarÃ¡ a “tecnologia de IA de ponta” para “reprimir alegaÃ§Ãµes falsas” com o objetivo de impedir que “adultos tentem burlar o sistema”.
18 de junho de 2026
FranÃ§a AvanÃ§a o Futuro da IA na Europa com Tecnologias NVIDIA
Um ano apÃ³s anunciar planos ambiciosos no VivaTech em Paris, a FranÃ§a estÃ¡ transformando suas ambiÃ§Ãµes de inteligÃªncia artificial em realidade concreta. Com novos data centers, modelos abertos e plataformas industriais entrando em operaÃ§Ã£o, o paÃs se consolida como um dos polos mais ativos de desenvolvimento de IA na Europa.

Infraestrutura de IA Francesa Toma Forma

A FranÃ§a estÃ¡ ganhando momento. BilhÃµes em investimentos atravÃ©s do programa France 2030, do AI Action Summit de 2025 e do Choose France Summit estÃ£o reforÃ§ando a posiÃ§Ã£o do paÃs como um dos principais destinos europeus para infraestrutura de IA.

A Mistral, startup francesa de IA, estÃ¡ construindo um novo data center de 44 megawatts em BruyÃ¨res-le-ChÃ¢tel, no norte da FranÃ§a. Sua primeira implantaÃ§Ã£o jÃ¡ estÃ¡ operacional com 18.000 sistemas NVIDIA GB200 â€” a base para o plano de 200 megawatts de capacidade de computaÃ§Ã£o na Europa atÃ© 2027.

A plataforma NVIDIA Blackwell foi projetada para ajudar AI factories a maximizar o rendimento dentro de orÃ§amentos fixos de energia, combinando silÃcio de maior desempenho por watt com recursos de software que aumentam a produtividade do data center.

A Mistral tambÃ©m estÃ¡ colaborando com o banco pÃºblico francÃªs Bpifrance, a empresa de investimentos MGX e a NVIDIA para expandir o Campus AI, uma rede de AI factories ancorada por uma instalaÃ§Ã£o planejada de 1,4 gigawatts â€” uma das maiores da Europa.

Outros players tambÃ©m estÃ£o avanÃ§ando:
- A Scaleway, provedora europeia de nuvem pÃºblica, agora oferece instÃ¢ncias NVIDIA Blackwell B300-SXM
- Bull e Foxconn anunciaram a produÃ§Ã£o do NVIDIA Vera Rubin NVL72 na Europa, com sistemas fabricados na RepÃºblica Tcheca e montados em Angers, FranÃ§a
- Um consÃ³rcio de oito empresas francesas apresentou proposta para sediar uma gigafactory europeia de IA na FranÃ§a
- A Schneider Electric fez parceria com a NVIDIA para desenvolver blueprints para AI factories em escala de gigawatts
Modelos Abertos Impulsionam o Desenvolvimento

O ecossistema francÃªs estÃ¡ produzindo modelos, datasets e plataformas adaptados a idiomas locais, contexto cultural e requisitos regulatÃ³rios europeus.

Pierre-Carl Langlais, CTO da Pleias, destacou no VivaTech: “O que vemos agora Ã© uma mudanÃ§a de construir um modelo isolado para executar infraestrutura contÃnua de modelos, onde modelos treinam os prÃ³ximos modelos, curam dados, geram ambientes sintÃ©ticos e verificam aprendizado por reforÃ§o.”

O NVIDIA Nemotron estÃ¡ avanÃ§ando com modelos abertos, datasets e playbooks. A Mistral, membro fundador da NVIDIA Nemotron Coalition, estÃ¡ contribuindo com expertise em desenvolvimento de modelos e capacidades multimodais.

Outros projetos importantes:
- LINAGORA: construindo modelos multilingues (famÃlia Luciole: 1B, 8B e 23B) com foco no idioma francÃªs, treinados no supercomputador Jean-Zay
- H Company: desenvolvendo Holotron, agentes de IA que interagem com qualquer interface de software como um humano faria
- Pleias: criou datasets sintÃ©ticos com preservaÃ§Ã£o de privacidade (Nemotron-Personas-France e Nemotron-Personas-Belgium)
IA em ProduÃ§Ã£o: Resultados Concretos

A transiÃ§Ã£o de piloto para produÃ§Ã£o Ã© a histÃ³ria definidora do Ãºltimo ano. Empresas francesas de todos os setores estÃ£o usando IA para aumentar eficiÃªncia, qualidade e velocidade:
- Sanofi: implantando agentes de IA em toda a cadeia de valor â€” da pesquisa e fabricaÃ§Ã£o a compras e TI
- Orange Business: plataforma Live Intelligence com mais de 100.000 usuÃ¡rios ativos internos, agora disponÃvel como soluÃ§Ã£o de IA agÃªntica para empresas europeias
- Stellantis: iniciativa de gÃªmeos digitais com IA em sua rede global de manufatura
- Dassault SystÃ¨mes: combinando gÃªmeos virtuais com infraestrutura de IA em sua plataforma 3DEXPERIENCE
- TotalEnergies: construindo o supercomputador Pangea 5 com Dell e NVIDIA para pesquisa sÃsmica e simulaÃ§Ã£o
- L’OrÃ©al: usando sua plataforma CreAltech para combinar IA generativa e gÃªmeos digitais 3D na produÃ§Ã£o de conteÃºdo
A trajetÃ³ria da FranÃ§a passou de anunciar ambiÃ§Ãµes de IA para implantar a infraestrutura, os modelos e as aplicaÃ§Ãµes necessÃ¡rias para realizÃ¡-las. As fundaÃ§Ãµes estÃ£o no lugar. O que serÃ¡ construÃdo sobre elas estÃ¡ apenas comeÃ§ando.

O VivaTech 2026 acontece em Paris de 17 a 20 de junho.
18 de junho de 2026
Midjourney revela scanner mÃ©dico de corpo inteiro e anuncia spa de saÃºde em San Francisco

O CEO do Midjourney, David Holz, acaba de revelar o primeiro produto de hardware da empresa â€” e nÃ£o tem nada a ver com as famosas “imagens de gatinhos” que o gerador de imagens da empresa produz. Chamado de The Midjourney Scanner, trata-se de um scanner corporal completo baseado em ultrassom que utiliza um anel de sensores para capturar fatias verticais do interior do corpo, analisando a composiÃ§Ã£o de mÃºsculos, gordura, ossos e Ã³rgÃ£os.

Holz afirmou que, idealmente, uma pessoa poderia fazer esse exame uma vez por ano â€” ou atÃ© todos os dias â€” e que o scanner “busca qualidade de imagem comparÃ¡vel Ã ressonÃ¢ncia magnÃ©tica em muitos aspectos”.

Como funciona o Midjourney Scanner

O processo de escaneamento comeÃ§a ao subir em uma plataforma que desce na Ã¡gua sobre trilhos, passando por um anel com milhares de transdutores que criam ondas ultrassÃ´nicas e registram as ondulaÃ§Ãµes geradas ao atravessarem o corpo. O sistema entÃ£o analisa esses dados para criar imagens 3D detalhadas. O escaneamento completo leva cerca de 60 segundos.

Nas palavras do prÃ³prio Midjourney:

ComeÃ§a ao entrar em uma piscina rasa de luz dourada. VocÃª entÃ£o comeÃ§a a descer na Ã¡gua. Seu corpo passa por um anel de sensores subaquÃ¡ticos, cada um agindo como um golfinho usando sua ecolocalizaÃ§Ã£o. Os sensores enviam ondas sonoras ultrassÃ´nicas atravÃ©s do seu corpo de todos os Ã¢ngulos. Com ondas suficientes e Ã¢ngulos suficientes, formamos uma imagem do que estÃ¡ acontecendo dentro do seu corpo.

O scanner combina esses sensores com dois petaflops de poder de processamento.

Parceria com Butterfly Network

O Midjourney Scanner foi desenvolvido em parceria com a empresa de tecnologia de ultrassom Butterfly Network, que afirmou que cada sistema utiliza 40 mÃ³dulos de imagem Butterfly Ultrasound-on-Chipâ„¢. Cerca de uma dÃºzia de pessoas jÃ¡ foram escaneadas atÃ© o momento.

Midjourney Spa em San Francisco

Holz planeja instalar 10 scanners em uma localizaÃ§Ã£o chamada Midjourney Spa, no Union Square em San Francisco, com inauguraÃ§Ã£o prevista antes do final de 2027. O spa contarÃ¡ com academia, saunas e banhos de imersÃ£o fria, alÃ©m das salas de escaneamento equipadas com banheiras de hidromassagem onde os visitantes entrarÃ£o na Ã¡gua para serem escaneados.

AplicaÃ§Ãµes mÃ©dicas e regulaÃ§Ã£o

Holz mencionou que vÃ¡rias aplicaÃ§Ãµes mÃ©dicas exigiriam aprovaÃ§Ãµes da FDA (agÃªncia reguladora dos EUA), mas por enquanto o Midjourney Medical estÃ¡ focado em “mapas de composiÃ§Ã£o corporal”, que nÃ£o exigem o mesmo nÃvel de autorizaÃ§Ã£o que imagens diagnÃ³sticas.

A empresa tambÃ©m afirma que a “biblioteca de escaneamentos” que os usuÃ¡rios criarem poderÃ¡ ser compartilhada com mÃ©dicos, ferramentas de saÃºde com IA e outros profissionais. Sobre privacidade de dados, a empresa declarou: “Levamos a privacidade de dados a sÃ©rio â€” mais detalhes sobre nossas polÃticas de dados virÃ£o conforme nos aproximamos do lanÃ§amento.”

Holz sugeriu que, eventualmente, esses escaneamentos poderiam se tornar melhores que uma ressonÃ¢ncia magnÃ©tica, sem radiaÃ§Ã£o, ÃmÃ£s poderosos ou outros fatores complicadores, permitindo “ver o que estÃ¡ acontecendo dentro do corpo das pessoas muito rÃ¡pido”.

De imagens de gatos a scanner mÃ©dico

A transiÃ§Ã£o do Midjourney de gerar imagens com IA para hardware mÃ©dico Ã© uma das movimentaÃ§Ãµes mais surpreendentes do mundo da inteligÃªncia artificial em 2026. Holz admitiu que Ã© “um pouco diferente das imagens de gatinhos” produzidas pelo gerador de imagens da empresa.

O Midjourney Medical representa uma nova frente para a empresa, que busca aproveitar seu conhecimento em processamento de imagem e inteligÃªncia artificial para entrar no mercado de saÃºde preventiva â€” um setor avaliado em centenas de bilhÃµes de dÃ³lares.

Fonte: The Verge â€” Richard Lawler, 18 de junho de 2026.

18 de junho de 2026
OpenAI LanÃ§a LifeSciBench: Benchmark com 750 Tarefas Avalia Modelos de IA em Pesquisas Reais de BiociÃªncias
A OpenAI acaba de lanÃ§ar o LifeSciBench, um benchmark ambicioso com 750 tarefas desenvolvidas para avaliar modelos de IA em cenÃ¡rios reais de pesquisa em biociÃªncias. O resultado? AtÃ© o modelo mais forte da OpenAI, o GPT-Rosalind, passa em apenas 36,1% das tarefas â€” mostrando que ainda hÃ¡ um longo caminho pela frente.

O que Ã© o LifeSciBench

Diferente dos benchmarks tradicionais de biologia, que costumam fazer perguntas factuais com respostas limpas, o LifeSciBench coloca os modelos diante de problemas que cientistas reais enfrentam: pesar evidÃªncias imperfeitas, tomar decisÃµes com dados incompletos e navegar por mÃºltiplas etapas de raciocÃnio.

As 750 tarefas cobrem sete fluxos de trabalho (anÃ¡lise, design e otimizaÃ§Ã£o, raciocÃnio cientÃfico, validaÃ§Ã£o, traduÃ§Ã£o, comunicaÃ§Ã£o cientÃfica e operaÃ§Ãµes) e sete domÃnios biolÃ³gicos (genÃ´mica, quÃmica medicinal, ciÃªncia clÃnica e translacional, entre outros).

Cada tarefa Ã© de resposta livre â€” nada de mÃºltipla escolha. Cerca de 79% exigem mÃºltiplas etapas de raciocÃnio, com uma mÃ©dia de quatro passos por tarefa.

Como o benchmark foi construÃdo

Uma coorte de 173 cientistas Ph.D. com experiÃªncia em biotecnologia e farmacÃªutica escreveram as tarefas. Cada uma passou por uma mÃ©dia de seis ciclos de revisÃ£o automatizada e pelo menos duas revisÃµes por especialistas.

O benchmark inclui 1.062 artefatos anexados â€” sequÃªncias, figuras, tabelas, PDFs e estruturas quÃmicas. Cerca de 53% das tarefas exigem pelo menos um artefato.

A validaÃ§Ã£o foi feita por 453 revisores independentes, 97% com doutorado. A concordÃ¢ncia entre eles ultrapassou 96% em relevÃ¢ncia, raciocÃnio, fundamentaÃ§Ã£o e utilidade.

O sistema de rubricas

O coraÃ§Ã£o do LifeSciBench sÃ£o as rubricas de avaliaÃ§Ã£o: 19.020 critÃ©rios no total, aproximadamente 25 por tarefa. Cada critÃ©rio pontua uma propriedade concreta â€” um fato especÃfico, um passo de raciocÃnio ou uma resposta numÃ©rica dentro de uma margem de tolerÃ¢ncia.

Duas mÃ©tricas resumem o desempenho:
- PontuaÃ§Ã£o normalizada da rubrica: divide os pontos ganhos pelo total de pontos possÃveis
- Taxa de aprovaÃ§Ã£o: conta as tarefas com pontuaÃ§Ã£o â‰¥ 70%
Uma resposta pode ganhar crÃ©dito parcial e ainda assim falhar na tarefa â€” e Ã© exatamente essa lacuna que o LifeSciBench mede.

Desempenho dos modelos

A OpenAI avaliou cinco modelos em configuraÃ§Ã£o de turno Ãºnico, com navegaÃ§Ã£o irrestrita na internet:

Modelo PontuaÃ§Ã£o Normalizada Taxa de AprovaÃ§Ã£o

GPT-Rosalind 0,576 36,1%

GPT-5.5 0,519 25,7%

Gemini 3.1 Pro 0,515 23,6%

GPT-5.4 0,479 20,7%

Grok 4.3 0,399 13,0%

O GPT-Rosalind, modelo especializado em domÃnios cientÃficos da OpenAI, liderou no geral, mas foi o melhor em apenas 386 das 750 tarefas. O Gemini 3.1 Pro, do Google, liderou isoladamente em 214 tarefas â€” mostrando que rankings agregados escondem forÃ§as especÃficas de cada modelo.

Onde os modelos tropeÃ§am

Os modelos foram mais fortes em julgamento estruturado. O GPT-Rosalind atingiu pontuaÃ§Ã£o mÃ©dia de 0,712 em TraduÃ§Ã£o e 0,718 em ComunicaÃ§Ã£o CientÃfica.

Mas dois fluxos de trabalho continuaram extremamente difÃceis:
- Design, OtimizaÃ§Ã£o e PrediÃ§Ã£o: apenas 30,7% de aprovaÃ§Ã£o
- AnÃ¡lise: apenas 30,3% de aprovaÃ§Ã£o
O uso de artefatos foi um gargalo claro. O GPT-Rosalind caiu de 45,1% em tarefas sÃ³ de texto para 28,1% em tarefas com artefatos. O GPT-5.5 caiu de 29,9% para 21,9%.

Nenhum modelo passou em 171 tarefas (22,8%), e 261 tarefas (34,8%) tiveram taxa de aprovaÃ§Ã£o do melhor modelo abaixo de 20%.

Por que isso importa

O LifeSciBench representa uma mudanÃ§a significativa na forma como avaliamos IA para ciÃªncias da vida. Em vez de perguntas de trivia biolÃ³gica, ele testa se os modelos conseguem raciocinar como cientistas: analisar evidÃªncias, projetar experimentos, interpretar resultados ambÃguos e comunicar descobertas.

Com 36,1% de aprovaÃ§Ã£o do melhor modelo, o benchmark estÃ¡ longe de ser saturado. Isso significa que hÃ¡ espaÃ§o real para avanÃ§os â€” e o LifeSciBench servirÃ¡ como rÃ©gua para medir o progresso da IA nas biociÃªncias nos prÃ³ximos anos.

O paper completo e detalhes tÃ©cnicos estÃ£o disponÃveis no site do LifeSciBench.
18 de junho de 2026
Google Vids: como criar vÃdeos profissionais com avatares de IA sem custo

O Google acaba de anunciar grandes novidades para o Google Vids, sua ferramenta de criaÃ§Ã£o de vÃdeos com inteligÃªncia artificial integrada ao Workspace. Com os novos avatares de IA, narraÃ§Ãµes por voz sintÃ©tica e geraÃ§Ã£o automÃ¡tica de roteiros, qualquer pessoa com uma conta Google nos EUA jÃ¡ pode criar vÃdeos profissionais â€” sem custo adicional. O lanÃ§amento serÃ¡ expandido para outras regiÃµes nos prÃ³ximos meses.

A promessa Ã© ambiciosa: eliminar a barreira da produÃ§Ã£o de vÃdeo corporativo, que historicamente exige equipamento caro, horas de gravaÃ§Ã£o e softwares complexos. Com o Google Vids, bastam alguns cliques para transformar apresentaÃ§Ãµes, pitches de vendas e demonstraÃ§Ãµes de produto em vÃdeos polidos com apresentadores digitais.

Mais de 7 milhÃµes de usuÃ¡rios jÃ¡ utilizam o Google Vids mensalmente. Veja como aproveitar os novos recursos em trÃªs cenÃ¡rios prÃ¡ticos.

1. Transforme apresentaÃ§Ãµes estÃ¡ticas em vÃdeos dinÃ¢micos

Quem nunca assistiu a uma apresentaÃ§Ã£o arrastada onde os pontos-chave simplesmente nÃ£o grudam? E, como apresentador, vocÃª conhece a dor de ter que repetir o mesmo conteÃºdo para cobrir mÃºltiplos fusos horÃ¡rios ou integrar novos membros da equipe.

Com a nova integraÃ§Ã£o com o Google Slides, vocÃª converte suas apresentaÃ§Ãµes em vÃdeos escalÃ¡veis e envolventes com poucos cliques. O Vids cria automaticamente um storyboard a partir do seu conteÃºdo e gera um roteiro para um avatar de IA.

Esses avatares atuam como apresentadores digitais e podem ser re-roteirizados a qualquer momento â€” se sua mensagem ou conteÃºdo precisar de atualizaÃ§Ã£o, basta ajustar o texto.

Para situaÃ§Ãµes em que um avatar na tela nÃ£o Ã© necessÃ¡rio, vocÃª pode optar por uma narraÃ§Ã£o por voz de IA. Em breve, serÃ¡ possÃvel gerar narraÃ§Ãµes em 8 idiomas, incluindo japonÃªs, coreano, espanhol e francÃªs â€” ideal para alcanÃ§ar audiÃªncias globais sem regravaÃ§Ãµes.

2. Crie pitches de vendas que escalam em mÃºltiplos idiomas

Fazer um pitch Ã© uma arte que leva tempo para ser aperfeiÃ§oada â€” e repetiÃ§Ã£o para escalar. O Google Vids resolve ambos os problemas com vÃdeos que apresentam o rosto e a voz consistentes de um avatar de IA.

AlÃ©m de criar avatares personalizados com o logotipo da sua empresa e fundo customizado, a partir do final de junho vocÃª poderÃ¡ controlar a emoÃ§Ã£o dos avatares. Isso permite ajustar a entrega da mensagem para combinar perfeitamente com a intenÃ§Ã£o do seu discurso â€” mais entusiasmo, urgÃªncia ou calma, conforme a necessidade.

Depois de ter o pitch perfeito, vocÃª pode escalÃ¡-lo globalmente gerando avatares e narraÃ§Ãµes a partir de roteiros escritos em 24 idiomas, incluindo Ã¡rabe, hindi, holandÃªs e vietnamita.

3. Demonstre seu produto sem precisar de uma produÃ§Ã£o de vÃdeo

Mostrar seu produto em aÃ§Ã£o Ã© a melhor forma de educar clientes, mas demonstraÃ§Ãµes tradicionais sÃ£o caras de produzir e notoriamente difÃceis de manter atualizadas.

Os avatares de IA removem esse custo de produÃ§Ã£o, e as novas melhorias dÃ£o ainda mais controle criativo. Agora vocÃª pode direcionar avatares personalizados para andar, falar e interagir com objetos â€” basta adicionar os elementos como “ingredientes” e digitar um prompt.

O melhor: agora Ã© possÃvel criar clipes de vÃdeo em alta fidelidade sem limite de duraÃ§Ã£o, permitindo construir demonstraÃ§Ãµes completas do inÃcio ao fim, sem pressa e sem cortes forÃ§ados.

Comece a criar hoje

“Fiquei impressionado com a forma como o Vids transforma nossos decks de vendas em vÃdeos curtos de demonstraÃ§Ã£o para clientes. Isso mudou completamente como personalizamos nosso alcance. O time de vendas acha que Ã© mÃ¡gica!”
â€” Forest Donovan, Sr. Director of Strategic Alliances, Fullstory

Pronto para fazer sua prÃ³pria mÃ¡gica? Comece agora mesmo acessando vids.new. Qualquer pessoa com uma conta Google nos EUA pode usar os avatares de IA sem custo â€” e a disponibilidade estÃ¡ chegando a outras regiÃµes nos prÃ³ximos meses.

Fonte: Google Workspace Blog â€” David Nachum, Product Manager, Google Vids

18 de junho de 2026
Amazon Quick ganha agentes autÃ´nomos de IA e consultas cross-source
A AWS anunciou uma grande expansÃ£o do Amazon Quick, seu assistente de anÃ¡lise de dados baseado em IA, com novos agentes autÃ´nomos que trabalham continuamente em nome dos usuÃ¡rios.

Agentes autÃ´nomos no Quick

Os novos agentes autÃ´nomos do Amazon Quick sÃ£o capazes de executar tarefas de anÃ¡lise de dados de forma proativa, sem intervenÃ§Ã£o humana constante. Eles podem:
- Monitorar mÃ©tricas de negÃ³cio em tempo real
- Detectar anomalias e padrÃµes nos dados automaticamente
- Gerar alertas quando condiÃ§Ãµes especÃficas sÃ£o atendidas
- Preparar relatÃ³rios e dashboards de forma autÃ´noma
- Responder perguntas complexas consultando mÃºltiplas fontes de dados
Activity Feed inteligente

Junto com os agentes, o Quick ganha um Activity Feed que ajuda a priorizar o trabalho mais importante. Este feed centraliza notificaÃ§Ãµes, insights gerados por agentes e tarefas pendentes, funcionando como um hub de produtividade para analistas de dados.

Consultas cross-source

Outra novidade Ã© a capacidade de fazer perguntas em linguagem natural que consultam todas as fontes de dados que a empresa utiliza â€” bancos SQL, data lakes, APIs, planilhas â€” a partir de uma Ãºnica interface. Isso elimina a necessidade de alternar entre diferentes ferramentas de anÃ¡lise.

Impacto para times de dados

Com estas atualizaÃ§Ãµes, o Quick se posiciona como uma plataforma de anÃ¡lise aumentada que vai alÃ©m da simples geraÃ§Ã£o de grÃ¡ficos. Os agentes autÃ´nomos permitem que analistas foquem em tarefas estratÃ©gicas enquanto a IA cuida do monitoramento contÃnuo e da detecÃ§Ã£o de insights.

A AWS afirma que a funcionalidade pode “devolver horas todos os dias” para equipes de dados, reduzindo drasticamente o tempo gasto em tarefas repetitivas de monitoramento e preparaÃ§Ã£o de relatÃ³rios.

Fonte: AWS Machine Learning Blog
18 de junho de 2026
AWS SageMaker AI agora suporta payloads inline na inferÃªncia assÃncrona
A AWS anunciou uma atualizaÃ§Ã£o importante para o Amazon SageMaker AI Async Inference: agora Ã© possÃvel enviar os payloads de inferÃªncia diretamente no corpo da requisiÃ§Ã£o da API InvokeEndpointAsync, sem a necessidade de fazer upload prÃ©vio para o Amazon S3.

O que mudou?

Antes deste anÃºncio, para usar inferÃªncia assÃncrona no SageMaker AI, os clientes precisavam fazer o upload dos dados de entrada para um bucket S3 e depois referenciar esse local na chamada da API. Isso adicionava latÃªncia, complexidade de cÃ³digo e custos extras de armazenamento.

Agora, os payloads podem ser enviados inline â€” ou seja, diretamente no corpo da requisiÃ§Ã£o HTTP. O SageMaker AI gerencia o armazenamento temporÃ¡rio internamente, simplificando todo o fluxo.

Como funciona?

A nova funcionalidade suporta payloads de atÃ© 1 MB inline. Para cargas maiores, o upload via S3 continua sendo a abordagem recomendada. A API aceita os mesmos formatos de conteÃºdo de sempre: JSON, CSV, texto, imagens codificadas em base64, entre outros.

Exemplo simplificado de chamada:
```
aws sagemaker-runtime invoke-endpoint-async \
  --endpoint-name meu-endpoint \
  --content-type "application/json" \
  --body '{"inputs": "Exemplo de prompt"}'
```
Por que isso importa?

Este Ã© mais um passo da AWS para reduzir a fricÃ§Ã£o no uso de modelos de IA em produÃ§Ã£o. Para times que fazem inferÃªncias de baixa latÃªncia com payloads pequenos (como classificaÃ§Ã£o de texto, anÃ¡lise de sentimento, ou pequenas geraÃ§Ãµes de texto), a eliminaÃ§Ã£o da etapa de upload S3 significa:
- Menos cÃ³digo: sem gerenciar buckets, chaves e permissÃµes S3
- Menor latÃªncia: sem round-trip extra para upload
- Custo reduzido: sem cobranÃ§as adicionais de S3 para armazenamento temporÃ¡rio
A funcionalidade jÃ¡ estÃ¡ disponÃvel em todas as regiÃµes onde o SageMaker AI Async Inference Ã© suportado.

Fonte: AWS Machine Learning Blog
18 de junho de 2026