Blog

  • Cannes Lions 2026: NVIDIA e parceiros transformam publicidade e marketing com IA

    Cannes Lions 2026: NVIDIA e parceiros transformam publicidade e marketing com IA

    O Cannes Lions 2026, que acontece entre 22 e 26 de junho na França, será palco de uma verdadeira revolução na publicidade. A NVIDIA e seus parceiros — incluindo AWS, Criteo, Higgsfield, Taboola e Alembic — vão mostrar como a inteligência artificial está transformando o marketing e a publicidade, levando o setor da era digital para a era das operações autônomas com IA.

    “A era digital deu velocidade à indústria de publicidade e marketing; a era da IA está dando operações autônomas.”

    Inteligência de decisão em escala empresarial

    A plataforma de IA causal Alembic resolve um dos maiores desafios das empresas: provar quais iniciativas de marketing realmente geram crescimento, em vez de apenas reportar o que aconteceu.

    Modelar causalidade real simultaneamente em cada canal, mercado e audiência exige uma infraestrutura de IA capaz de processar datasets enormes em rápida mudança — e é aí que entram os sistemas NVIDIA DGX Vera Rubin NVL72.

    A Alembic será a primeira empresa de IA causal a usar NVIDIA DGX Vera Rubin SuperPODs para modelagem causal em escala empresarial. Com isso, executivos terão uma fonte única de verdade sobre o que realmente gerou resultados de negócio — e onde o capital está sendo desperdiçado.

    Lances inteligentes em velocidade de leilão

    Para anunciantes, veicular anúncios e recomendações relevantes em bilhões de transações diárias exige IA rápida, precisa e barata o suficiente para rodar em escala.

    A AWS está integrando infraestrutura de nuvem, modelos fundacionais e computação acelerada por GPUs NVIDIA em uma stack coesa para a indústria de adtech. Usando o NVIDIA Triton Inference Server, a AWS oferece inferência de deep learning rápida o suficiente para caber dentro das janelas de leilão em tempo real.

    A Criteo — uma das maiores redes de recomendação em publicidade digital — conseguiu um aumento de aproximadamente 2x na velocidade de treinamento de seus modelos em GPUs NVIDIA Blackwell, usando a biblioteca aberta NVIDIA cuEmbed. Essa eficiência já libera cerca de 17.000 horas de GPU por ano.

    A Taboola está usando GPUs NVIDIA para alimentar o DeeperDive, seu mecanismo de respostas com IA, e estendendo essa infraestrutura para plataformas de IA e chatbots que podem gerar receita com publicidade.

    Agentes de IA no fluxo de marketing

    Agentes de IA estão agindo cada vez mais como colegas de trabalho digitais, assumindo tarefas de longa duração em planejamento, execução e otimização. Mas para serem usados em escala empresarial, precisam de controles adequados: salvaguardas de segurança, auditabilidade e permissões baseadas em papéis.

    O NVIDIA Agent Toolkit, que inclui os blueprints NVIDIA NemoClaw e o runtime seguro NVIDIA OpenShell, fornece exatamente esses controles.

    A Higgsfield AI, plataforma de geração de vídeo e imagem com IA, oferece agentes do Higgsfield Supercomputer que gerenciam todo o ciclo de vida da automação de marketing: da ideação da campanha ao planejamento, produção criativa, publicação e otimização autônoma — tudo em uma única interface. Os agentes orquestram grandes modelos de linguagem junto com mais de 35 modelos de imagem, áudio e vídeo, incluindo os modelos proprietários Soul e Soul 2.0, construídos sobre a arquitetura NVIDIA Blackwell.

    Por que isso importa

    O Cannes Lions 2026 marca um ponto de inflexão para o marketing digital. A pergunta não é mais se as empresas devem adotar IA, mas se sua infraestrutura consegue suportar a velocidade e a escala que a indústria exige. A NVIDIA está mostrando que a resposta passa por computação acelerada, IA causal e agentes autônomos trabalhando juntos.

  • Quem decide quando a IA é perigosa demais? O caso Anthropic Fable 5

    Quem decide quando a IA é perigosa demais? O caso Anthropic Fable 5

    O governo dos Estados Unidos impôs controles de exportação sobre o Fable 5, novo modelo de IA da Anthropic — e a empresa respondeu tirando tudo do ar. O episódio, que mistura segurança nacional, regulação de inteligência artificial e tensões com a administração Trump, revela o caos por trás da pergunta que ninguém sabe responder: quem decide quando uma IA é perigosa demais?

    O que aconteceu

    Na sexta-feira, 13 de junho de 2026, menos de uma semana após a Anthropic lançar o Fable 5 ao público, o governo americano anunciou controles de exportação sobre o novo modelo e sobre o Mythos — o modelo-base que alimenta o Fable. As restrições impedem que cidadãos estrangeiros, mesmo aqueles que trabalham na Anthropic dentro dos Estados Unidos, acessem esses modelos.

    A resposta da Anthropic foi drástica: tirou tanto o Fable quanto o Mythos do ar para todos os usuários. A empresa afirmou que não conseguiria restringir o acesso e cumprir a ordem de forma razoável. Se você abrir o Claude hoje, verá a mensagem: “Fable 5 is currently unavailable.”

    A grande ironia

    A Anthropic passou anos argumentando que a IA poderia em breve se tornar poderosa o suficiente para ser perigosa — e que o governo precisava começar a regular a IA seriamente, quanto antes melhor.

    Agora que a regulação chegou, a Anthropic não está gostando nem um pouco de como está sendo feita.

    O episódio levanta questões profundas: o regime regulatório de IA dos EUA será uma estrutura séria de segurança, ou apenas mais uma arma para a Casa Branca usar contra empresas que não se alinham com o governo Trump?

    O que são Mythos e Fable

    O Mythos é o modelo-base que alimenta tanto o Mythos 5 quanto o Fable 5. Quando a Anthropic lançou o Mythos Preview em abril, a empresa fez um marketing pesado: descreveu o modelo como uma potencial ciberarma, capaz de realizar tarefas ofensivas de segurança cibernética no nível de especialistas humanos.

    Já o Fable 5 é a versão “domada” do Mythos — com mais salvaguardas e restrições de segurança. É o modelo que o público pode usar.

    Por que isso importa

    Este caso é um marco para a governança de IA nos Estados Unidos. Pela primeira vez, o governo usou controles de exportação para restringir um modelo de IA de uma empresa americana. As implicações vão muito além da Anthropic:

    • Precedente para outras empresas: OpenAI, Google DeepMind e Meta estão observando
    • China e outros países: estão atentos para ver se a regulação americana é sobre segurança ou sobre controle político
    • Startups de IA: podem enfrentar incerteza regulatória ao lançar modelos poderosos

    O podcast Decoder, do The Verge, entrevistou Hayden Field, repórter sênior de IA, que detalhou toda a cronologia dos eventos — desde o anúncio de sexta-feira até as negociações do fim de semana que, até terça-feira (17 de junho), ainda não haviam chegado a uma resolução.

    O que esperar

    A situação continua em aberto. O Fable 5 segue offline e não há previsão de quando voltará. Mas uma coisa é certa: o debate sobre quem decide quando uma IA é perigosa demais está longe de terminar — e a cada novo lançamento de modelo, essa pergunta voltará com ainda mais força.

  • Adobe lança assistentes de IA no Photoshop, Premiere e Illustrator

    Adobe lança assistentes de IA no Photoshop, Premiere e Illustrator

    A Adobe acaba de anunciar uma das maiores expansões de IA em suas ferramentas criativas: assistentes de IA nativos no Photoshop, Premiere Pro e Illustrator. Os recursos, alimentados pelo Adobe Firefly, permitem edição por comandos de texto diretamente dentro dos aplicativos.

    O que mudou em cada app

    Photoshop: o novo assistente entende linguagem natural. Você pode digitar algo como “remova o fundo e aplique um tom sépia” ou “aumente o contraste do céu sem afetar o primeiro plano” — e o Photoshop executa. Ele também sugere edições baseadas no contexto da imagem.

    Premiere Pro: o assistente de vídeo consegue gerar transcrições automáticas, sugerir cortes baseados em ritmo, e até recomendar trilhas sonoras que combinem com o tom do vídeo. Comandos como “corte as cenas mais silenciosas e acelere a transição” agora funcionam por texto.

    Illustrator: foco em geração de variações de design — o assistente pode criar paletas de cores alternativas, sugerir layouts e gerar elementos vetoriais descritos em texto.

    Firefly redesenhado

    Junto com os assistentes, a Adobe também revelou um Firefly Studio reformulado que agora “lembra” como suas criações se parecem. O novo sistema mantém um histórico visual do seu estilo, paletas e preferências, aplicando esse contexto automaticamente em novos projetos. É uma espécie de memória criativa persistente.

    O que está em jogo

    A Adobe aposta forte na integração de IA generativa com fluxos de trabalho profissionais. Diferente de geradores de imagem standalone, os assistentes têm acesso ao histórico de camadas, seleções e metadados do projeto — o que permite um nível de contexto impossível em ferramentas genéricas.

    Os recursos entram em beta ainda esta semana para assinantes Creative Cloud. A empresa não revelou preços adicionais, mas é provável que créditos generativos do Firefly sejam consumidos por uso.

  • Google DeepMind publica roadmap de segurança para agentes de IA

    Google DeepMind publica roadmap de segurança para agentes de IA

    O Google DeepMind acaba de publicar seu AI Control Roadmap, um framework abrangente de “defesa em profundidade” para gerenciar agentes de IA cada vez mais capazes — mesmo quando o alinhamento é imperfeito. O anúncio vem acompanhado do documento técnico “Three Layers of Agentic Security”, direcionado a legisladores e à indústria.

    O problema: agentes de IA podem agir de forma inesperada

    Agentes de IA estão transformando setores inteiros — da defesa cibernética à descoberta científica. Só nos EUA, a estimativa é de que agentes de IA gerem US$ 2,9 trilhões em valor econômico até 2030. Mas conforme esses sistemas ganham autonomia para executar tarefas complexas, os riscos também aumentam.

    A premissa do roadmap é clara e cautelosa: e se um agente de IA altamente capaz não estiver alinhado com nossos objetivos e agir de forma inesperada?

    Três pilares do AI Control Roadmap

    O framework do DeepMind se apoia em três áreas:

    1. Modelagem de ameaças: tratando agentes de IA não confiáveis como potenciais “ameaças internas” (insider threats), usando o padrão MITRE ATT&CK adaptado para IA. Isso permite rastrear riscos metodicamente e simular ataques para testar as defesas.

    2. Mitigações de controle: implantação de barreiras como segmentação de rede, sandboxing e privilégio mínimo. O sistema concede permissões baseadas em comportamento verificado — uma abordagem de “confiança incremental”.

    3. Monitoramento contínuo: medição de três métricas críticas: cobertura (tráfego monitorado), recall (comportamentos indevidos detectados) e tempo de resposta.

    Um milhão de trajetórias analisadas

    A equipe do DeepMind já construiu um protótipo interno que analisa um milhão de tarefas de agentes de código, classificando eventos suspeitos contra a taxonomia de ameaças do roadmap. Os dados revelam algo importante: a maioria dos alertas não vem de intenção maliciosa, mas de má interpretação ou excesso de zelo do agente para atingir o objetivo do usuário.

    “Entender essas nuances é fundamental para refinar nossos protocolos de segurança”, afirma o time.

    O sistema já está em uso para monitorar o Gemini Spark agent em tempo real, respondendo a problemas emergentes como exclusão acidental de dados.

    Um chamado à colaboração

    O DeepMind defende que a segurança de agentes é uma responsabilidade compartilhada entre indústria, legisladores e academia. O documento “Three Layers of Agentic Security” detalha como melhorar a segurança em três níveis: agentes individuais, sistemas multiagentes e resiliência do ecossistema.

    A analogia usada pelos pesquisadores é simples e poderosa: “Pense em um instrutor de direção com controle duplo. O instrutor confia no aluno, mas está pronto para assumir o volante ou frear se algo der errado.”

  • Corrida da Compressão KV Cache: TurboQuant vs OSCAR vs EpiCache

    Corrida da Compressão KV Cache: TurboQuant vs OSCAR vs EpiCache

    Comparação TurboQuant vs OSCAR vs EpiCache

    Modelos de linguagem grandes (LLMs) com contexto longo enfrentam um gargalo de memória que não tem nada a ver com os pesos do modelo. Durante a decodificação, os transformers armazenam em cache os vetores key e value (KV) de cada token em cada camada para evitar recomputar a atenção. Esse cache cresce linearmente com o comprimento da sequência e o tamanho do batch — em contextos longos com alta concorrência, ele pode superar o footprint do próprio modelo.

    Considere o Llama-3.1-70B em BF16. Seu cache KV consome cerca de 0,31 MB por token. Em 128K tokens, isso representa aproximadamente 40 GB; em 1M tokens, ultrapassa 300 GB — mais que os 140 GB dos pesos do modelo. Pior: cada novo token decodificado precisa carregar todo o cache da memória de alta largura de banda (HBM), tornando a decodificação limitada pela largura de banda de memória, não pela computação.

    Três métodos recentes de 2026 atacam esse problema de ângulos complementares: TurboQuant (Google/NYU), OSCAR (Together AI) e EpiCache (Apple).

    TurboQuant: Teoricamente Ótimo e Agnóstico a Modelos

    O TurboQuant lida com outliers sem nunca examinar os dados, em dois estágios:

    • Estágio 1: cada vetor é rotacionado aleatoriamente para que suas coordenadas se tornem aproximadamente independentes e gaussianas, permitindo quantização escalar ótima (Lloyd-Max) por coordenada.
    • Estágio 2: uma transformação Quantized Johnson-Lindenstrauss (QJL) de 1 bit é aplicada ao resíduo, produzindo uma estimativa não enviesada dos logits de atenção.

    A distorção do TurboQuant é comprovadamente dentro de um fator constante (~2,7×) do limite inferior da teoria da informação. Na prática, atinge recall praticamente de precisão total no Needle-in-a-Haystack com compressão de 4×. Seu ponto ideal fica no regime de 3-4 bits com qualidade quase sem perdas. Por não precisar de calibração, funciona em qualquer modelo imediatamente.

    OSCAR: INT2 Pronto para Produção

    O OSCAR aposta na direção oposta. Sua premissa é que, com apenas 4 níveis do INT2, uma rotação cega não é suficiente. O OSCAR calcula uma rotação consciente da atenção a partir de uma calibração offline única:

    • Chaves são rotacionadas para a base própria da covariância de queries.
    • Valores são rotacionados para a covariância ponderada por score.
    • Uma transformação Hadamard com permutação bit-reversal distribui a importância dos canais uniformemente.

    O diferencial do OSCAR é ser um sistema completo: cache paginado de precisão mista (tokens recentes em BF16, histórico em INT2), kernels Triton fundidos com integração SGLang, e um “RotationZoo” com rotações pré-computadas para Qwen3, GLM-4 e MiniMax-M2.

    Com 2,28 bits efetivos, o OSCAR fica a 1,42 pontos do BF16 no Qwen3-8B e praticamente empata no Qwen3-32B. A Together AI relata até 7,83× de throughput e ~8× de redução de memória em contexto de 100K, com decodificação até ~3× mais rápida.

    EpiCache: Memória Conversacional

    TurboQuant e OSCAR são otimizados para um único contexto longo. Nenhum lida bem com conversas multi-turno, onde o histórico se acumula através de várias trocas. O EpiCache da Apple ataca exatamente essa lacuna, com três inovações:

    • Pré-preenchimento em blocos: processa o histórico em blocos para manter o pico de memória controlado.
    • Agrupamento episódico: segmenta a conversa em “episódios” semânticos coerentes, cada um com seu próprio cache comprimido.
    • Orçamento adaptativo por camada: mede a sensibilidade de cada camada à remoção e distribui o orçamento de memória de acordo.

    Nos benchmarks LongMemEval, RealTalk e LoCoMo, o EpiCache reporta até 40% mais acurácia que baselines de evicção, precisão próxima ao cache completo com compressão de 4-6×, e até 3,5× menos pico de memória. Por decidir quais tokens manter (em vez de com que precisão armazená-los), ele se compõe diretamente com OSCAR ou TurboQuant para economias cumulativas.

    Qual Escolher?

    Nenhum vence em todos os cenários — e essa é a resposta honesta. A escolha depende da restrição:

    • Orçamento de bits: TurboQuant para 3-4 bits near-lossless; OSCAR para INT2 extremo.
    • Portabilidade de modelo: TurboQuant funciona em qualquer modelo sem calibração; OSCAR precisa de rotações pré-computadas.
    • Conversas longas: EpiCache resolve o problema que os outros dois ignoram.

    Essas abordagens são mais complementares do que competitivas. Combinar a rotação consciente de calibração do OSCAR com o quantizador escalar ótimo do TurboQuant é uma possibilidade promissora que nenhuma equipe publicou ainda — embora ambos os times tenham mencionado a ideia publicamente.


    Fontes:
    – TurboQuant: arXiv 2504.19874
    – OSCAR: arXiv 2605.17757
    – EpiCache: arXiv 2509.17396

  • Reino Unido Vai Escanear Rostos de Solicitantes de Asilo para Verificação de Idade — Mesmo Sabendo que a Tecnologia É Falha

    Reino Unido Vai Escanear Rostos de Solicitantes de Asilo para Verificação de Idade — Mesmo Sabendo que a Tecnologia É Falha

    A partir do próximo ano, o governo britânico planeja introduzir a estimativa facial de idade — onde uma IA escaneia seu rosto e sugere quantos anos você tem — para ajudar a determinar a idade de solicitantes de asilo que chegam à fronteira do Reino Unido. A medida é considerada a primeira vez que um sistema de estimativa facial de idade (FAE, na sigla em inglês) é usado dessa forma.

    Uma investigação da WIRED e Lighthouse Reports, em colaboração com o The Independent, obteve um relatório interno do governo do Reino Unido detalhando seus testes de tecnologias FAE. Os resultados mostram como os sistemas regularmente confundem crianças com adultos e contêm sérios problemas de viés, que impactam diretamente o maior grupo de migrantes sujeitos a avaliações de idade em 2025.

    Os Números Alarmantes

    O documento vazado do Home Office detalha o “melhor” dos sete algoritmos de estimativa facial de idade testados no ano passado. As descobertas são preocupantes:

    • O sistema teve desempenho significativamente pior ao estimar idades de africanos subsaarianos comparado a outros grupos
    • Para mulheres subsaarianas, a idade estimada pelo sistema errou em média 4,6 anos — o que significa que uma menina de 13,5 anos poderia ser avaliada como adulta de 18 anos
    • Africanos subsaarianos são o maior grupo de migrantes entrando no Reino Unido pelo Canal da Mancha e tiveram mais avaliações de idade questionadas em 2025
    • O relatório concluiu que as taxas de precisão dos algoritmos seriam ainda piores na prática, já que os testes usaram fotos de alta qualidade — enquanto fotos tiradas em pontos de entrada são “rotineiramente piores”

    Tim Cole, professor emérito de estatística médica no University College London e ex-membro do comitê científico que assessorava o Home Office, descreve os escaneamentos faciais como “terrivelmente imprecisos”.

    O comitê foi dissolvido pelo Home Office enquanto explorava a introdução da IA. “Estávamos ansiosos para destacar as inadequações da estimativa facial de idade, mas essa oportunidade não nos foi apresentada, e então o comitê foi encerrado”, afirma Cole.

    Viés Sistêmico e Riscos

    Anos de resultados de testes do Instituto Nacional de Padrões e Tecnologia dos EUA (NIST) mostraram que a precisão dos sistemas FAE frequentemente depende da raça da pessoa analisada e da qualidade das fotos. Imagens de baixa qualidade — como as tiradas em más condições de iluminação — podem reduzir drasticamente o desempenho.

    A análise da WIRED e Lighthouse Reports de dados públicos sobre os sistemas da empresa alemã Cognitec — para quem o governo britânico pagou mais de US$ 400.000 em maio — descobriu que o sistema classificou incorretamente o dobro de adolescentes de 16 anos como tendo 18 anos ou mais quando testado em fotos de baixa qualidade de fronteiras, comparado a fotos de visto de alta qualidade.

    “Crianças Não Deveriam Ser Cobaias”

    Martha Dark, co-diretora executiva do grupo de direitos Foxglove, declarou: “Crianças que buscam asilo frequentemente sofreram traumas inimagináveis. Elas não deveriam ser cobaias de tecnologia experimental que tem imprecisão e viés racista incorporados.”

    A Foxglove, junto com outras 61 organizações, enviou uma carta aberta ao governo britânico pedindo que o Home Office abandone os planos de usar a ferramenta.

    O Que Diz o Governo

    Um porta-voz do Home Office afirmou que o escaneamento facial é projetado para ser uma ferramenta “adicional” para oficiais de fronteira e não “substituirá ou se sobreporá ao julgamento humano”. Contudo, o governo não respondeu a perguntas sobre como planeja usar a tecnologia em ambientes reais.

    “Em casos de incerteza”, disse o porta-voz, “os indivíduos serão sempre tratados como crianças até que uma avaliação adicional seja conduzida.”

    Especialistas temem que qualquer uso da tecnologia FAE nas fronteiras será desumanizante para as pessoas impactadas e pode se normalizar entre os funcionários. “Com o tempo, há um risco real de que isso se torne enraizado”, alerta Anna Bacciarelli, pesquisadora sênior da Human Rights Watch.


    A implantação do sistema foi adiada para 2027. O Home Office diz que usará a “tecnologia de IA de ponta” para “reprimir alegações falsas” com o objetivo de impedir que “adultos tentem burlar o sistema”.

  • França Avança o Futuro da IA na Europa com Tecnologias NVIDIA

    França Avança o Futuro da IA na Europa com Tecnologias NVIDIA

    Um ano após anunciar planos ambiciosos no VivaTech em Paris, a França está transformando suas ambições de inteligência artificial em realidade concreta. Com novos data centers, modelos abertos e plataformas industriais entrando em operação, o país se consolida como um dos polos mais ativos de desenvolvimento de IA na Europa.

    Infraestrutura de IA Francesa Toma Forma

    A França está ganhando momento. Bilhões em investimentos através do programa France 2030, do AI Action Summit de 2025 e do Choose France Summit estão reforçando a posição do país como um dos principais destinos europeus para infraestrutura de IA.

    A Mistral, startup francesa de IA, está construindo um novo data center de 44 megawatts em Bruyères-le-Châtel, no norte da França. Sua primeira implantação já está operacional com 18.000 sistemas NVIDIA GB200 — a base para o plano de 200 megawatts de capacidade de computação na Europa até 2027.

    A plataforma NVIDIA Blackwell foi projetada para ajudar AI factories a maximizar o rendimento dentro de orçamentos fixos de energia, combinando silício de maior desempenho por watt com recursos de software que aumentam a produtividade do data center.

    A Mistral também está colaborando com o banco público francês Bpifrance, a empresa de investimentos MGX e a NVIDIA para expandir o Campus AI, uma rede de AI factories ancorada por uma instalação planejada de 1,4 gigawatts — uma das maiores da Europa.

    Outros players também estão avançando:

    • A Scaleway, provedora europeia de nuvem pública, agora oferece instâncias NVIDIA Blackwell B300-SXM
    • Bull e Foxconn anunciaram a produção do NVIDIA Vera Rubin NVL72 na Europa, com sistemas fabricados na República Tcheca e montados em Angers, França
    • Um consórcio de oito empresas francesas apresentou proposta para sediar uma gigafactory europeia de IA na França
    • A Schneider Electric fez parceria com a NVIDIA para desenvolver blueprints para AI factories em escala de gigawatts

    Modelos Abertos Impulsionam o Desenvolvimento

    O ecossistema francês está produzindo modelos, datasets e plataformas adaptados a idiomas locais, contexto cultural e requisitos regulatórios europeus.

    Pierre-Carl Langlais, CTO da Pleias, destacou no VivaTech: “O que vemos agora é uma mudança de construir um modelo isolado para executar infraestrutura contínua de modelos, onde modelos treinam os próximos modelos, curam dados, geram ambientes sintéticos e verificam aprendizado por reforço.”

    O NVIDIA Nemotron está avançando com modelos abertos, datasets e playbooks. A Mistral, membro fundador da NVIDIA Nemotron Coalition, está contribuindo com expertise em desenvolvimento de modelos e capacidades multimodais.

    Outros projetos importantes:

    • LINAGORA: construindo modelos multilingues (família Luciole: 1B, 8B e 23B) com foco no idioma francês, treinados no supercomputador Jean-Zay
    • H Company: desenvolvendo Holotron, agentes de IA que interagem com qualquer interface de software como um humano faria
    • Pleias: criou datasets sintéticos com preservação de privacidade (Nemotron-Personas-France e Nemotron-Personas-Belgium)

    IA em Produção: Resultados Concretos

    A transição de piloto para produção é a história definidora do último ano. Empresas francesas de todos os setores estão usando IA para aumentar eficiência, qualidade e velocidade:

    • Sanofi: implantando agentes de IA em toda a cadeia de valor — da pesquisa e fabricação a compras e TI
    • Orange Business: plataforma Live Intelligence com mais de 100.000 usuários ativos internos, agora disponível como solução de IA agêntica para empresas europeias
    • Stellantis: iniciativa de gêmeos digitais com IA em sua rede global de manufatura
    • Dassault Systèmes: combinando gêmeos virtuais com infraestrutura de IA em sua plataforma 3DEXPERIENCE
    • TotalEnergies: construindo o supercomputador Pangea 5 com Dell e NVIDIA para pesquisa sísmica e simulação
    • L’Oréal: usando sua plataforma CreAltech para combinar IA generativa e gêmeos digitais 3D na produção de conteúdo

    A trajetória da França passou de anunciar ambições de IA para implantar a infraestrutura, os modelos e as aplicações necessárias para realizá-las. As fundações estão no lugar. O que será construído sobre elas está apenas começando.


    O VivaTech 2026 acontece em Paris de 17 a 20 de junho.

  • Midjourney revela scanner médico de corpo inteiro e anuncia spa de saúde em San Francisco

    Midjourney revela scanner médico de corpo inteiro e anuncia spa de saúde em San Francisco

    O CEO do Midjourney, David Holz, acaba de revelar o primeiro produto de hardware da empresa — e não tem nada a ver com as famosas “imagens de gatinhos” que o gerador de imagens da empresa produz. Chamado de The Midjourney Scanner, trata-se de um scanner corporal completo baseado em ultrassom que utiliza um anel de sensores para capturar fatias verticais do interior do corpo, analisando a composição de músculos, gordura, ossos e órgãos.

    Holz afirmou que, idealmente, uma pessoa poderia fazer esse exame uma vez por ano — ou até todos os dias — e que o scanner “busca qualidade de imagem comparável à ressonância magnética em muitos aspectos”.

    Como funciona o Midjourney Scanner

    O processo de escaneamento começa ao subir em uma plataforma que desce na água sobre trilhos, passando por um anel com milhares de transdutores que criam ondas ultrassônicas e registram as ondulações geradas ao atravessarem o corpo. O sistema então analisa esses dados para criar imagens 3D detalhadas. O escaneamento completo leva cerca de 60 segundos.

    Nas palavras do próprio Midjourney:

    Começa ao entrar em uma piscina rasa de luz dourada. Você então começa a descer na água. Seu corpo passa por um anel de sensores subaquáticos, cada um agindo como um golfinho usando sua ecolocalização. Os sensores enviam ondas sonoras ultrassônicas através do seu corpo de todos os ângulos. Com ondas suficientes e ângulos suficientes, formamos uma imagem do que está acontecendo dentro do seu corpo.

    O scanner combina esses sensores com dois petaflops de poder de processamento.

    Parceria com Butterfly Network

    O Midjourney Scanner foi desenvolvido em parceria com a empresa de tecnologia de ultrassom Butterfly Network, que afirmou que cada sistema utiliza 40 módulos de imagem Butterfly Ultrasound-on-Chip™. Cerca de uma dúzia de pessoas já foram escaneadas até o momento.

    Midjourney Spa em San Francisco

    Holz planeja instalar 10 scanners em uma localização chamada Midjourney Spa, no Union Square em San Francisco, com inauguração prevista antes do final de 2027. O spa contará com academia, saunas e banhos de imersão fria, além das salas de escaneamento equipadas com banheiras de hidromassagem onde os visitantes entrarão na água para serem escaneados.

    Aplicações médicas e regulação

    Holz mencionou que várias aplicações médicas exigiriam aprovações da FDA (agência reguladora dos EUA), mas por enquanto o Midjourney Medical está focado em “mapas de composição corporal”, que não exigem o mesmo nível de autorização que imagens diagnósticas.

    A empresa também afirma que a “biblioteca de escaneamentos” que os usuários criarem poderá ser compartilhada com médicos, ferramentas de saúde com IA e outros profissionais. Sobre privacidade de dados, a empresa declarou: “Levamos a privacidade de dados a sério — mais detalhes sobre nossas políticas de dados virão conforme nos aproximamos do lançamento.”

    Holz sugeriu que, eventualmente, esses escaneamentos poderiam se tornar melhores que uma ressonância magnética, sem radiação, ímãs poderosos ou outros fatores complicadores, permitindo “ver o que está acontecendo dentro do corpo das pessoas muito rápido”.

    De imagens de gatos a scanner médico

    A transição do Midjourney de gerar imagens com IA para hardware médico é uma das movimentações mais surpreendentes do mundo da inteligência artificial em 2026. Holz admitiu que é “um pouco diferente das imagens de gatinhos” produzidas pelo gerador de imagens da empresa.

    O Midjourney Medical representa uma nova frente para a empresa, que busca aproveitar seu conhecimento em processamento de imagem e inteligência artificial para entrar no mercado de saúde preventiva — um setor avaliado em centenas de bilhões de dólares.


    Fonte: The Verge — Richard Lawler, 18 de junho de 2026.

  • OpenAI Lança LifeSciBench: Benchmark com 750 Tarefas Avalia Modelos de IA em Pesquisas Reais de Biociências

    OpenAI Lança LifeSciBench: Benchmark com 750 Tarefas Avalia Modelos de IA em Pesquisas Reais de Biociências

    A OpenAI acaba de lançar o LifeSciBench, um benchmark ambicioso com 750 tarefas desenvolvidas para avaliar modelos de IA em cenários reais de pesquisa em biociências. O resultado? Até o modelo mais forte da OpenAI, o GPT-Rosalind, passa em apenas 36,1% das tarefas — mostrando que ainda há um longo caminho pela frente.

    O que é o LifeSciBench

    Diferente dos benchmarks tradicionais de biologia, que costumam fazer perguntas factuais com respostas limpas, o LifeSciBench coloca os modelos diante de problemas que cientistas reais enfrentam: pesar evidências imperfeitas, tomar decisões com dados incompletos e navegar por múltiplas etapas de raciocínio.

    As 750 tarefas cobrem sete fluxos de trabalho (análise, design e otimização, raciocínio científico, validação, tradução, comunicação científica e operações) e sete domínios biológicos (genômica, química medicinal, ciência clínica e translacional, entre outros).

    Cada tarefa é de resposta livre — nada de múltipla escolha. Cerca de 79% exigem múltiplas etapas de raciocínio, com uma média de quatro passos por tarefa.

    Como o benchmark foi construído

    Uma coorte de 173 cientistas Ph.D. com experiência em biotecnologia e farmacêutica escreveram as tarefas. Cada uma passou por uma média de seis ciclos de revisão automatizada e pelo menos duas revisões por especialistas.

    O benchmark inclui 1.062 artefatos anexados — sequências, figuras, tabelas, PDFs e estruturas químicas. Cerca de 53% das tarefas exigem pelo menos um artefato.

    A validação foi feita por 453 revisores independentes, 97% com doutorado. A concordância entre eles ultrapassou 96% em relevância, raciocínio, fundamentação e utilidade.

    O sistema de rubricas

    O coração do LifeSciBench são as rubricas de avaliação: 19.020 critérios no total, aproximadamente 25 por tarefa. Cada critério pontua uma propriedade concreta — um fato específico, um passo de raciocínio ou uma resposta numérica dentro de uma margem de tolerância.

    Duas métricas resumem o desempenho:

    • Pontuação normalizada da rubrica: divide os pontos ganhos pelo total de pontos possíveis
    • Taxa de aprovação: conta as tarefas com pontuação ≥ 70%

    Uma resposta pode ganhar crédito parcial e ainda assim falhar na tarefa — e é exatamente essa lacuna que o LifeSciBench mede.

    Desempenho dos modelos

    A OpenAI avaliou cinco modelos em configuração de turno único, com navegação irrestrita na internet:

    Modelo Pontuação Normalizada Taxa de Aprovação
    GPT-Rosalind 0,576 36,1%
    GPT-5.5 0,519 25,7%
    Gemini 3.1 Pro 0,515 23,6%
    GPT-5.4 0,479 20,7%
    Grok 4.3 0,399 13,0%

    O GPT-Rosalind, modelo especializado em domínios científicos da OpenAI, liderou no geral, mas foi o melhor em apenas 386 das 750 tarefas. O Gemini 3.1 Pro, do Google, liderou isoladamente em 214 tarefas — mostrando que rankings agregados escondem forças específicas de cada modelo.

    Onde os modelos tropeçam

    Os modelos foram mais fortes em julgamento estruturado. O GPT-Rosalind atingiu pontuação média de 0,712 em Tradução e 0,718 em Comunicação Científica.

    Mas dois fluxos de trabalho continuaram extremamente difíceis:

    • Design, Otimização e Predição: apenas 30,7% de aprovação
    • Análise: apenas 30,3% de aprovação

    O uso de artefatos foi um gargalo claro. O GPT-Rosalind caiu de 45,1% em tarefas só de texto para 28,1% em tarefas com artefatos. O GPT-5.5 caiu de 29,9% para 21,9%.

    Nenhum modelo passou em 171 tarefas (22,8%), e 261 tarefas (34,8%) tiveram taxa de aprovação do melhor modelo abaixo de 20%.

    Por que isso importa

    O LifeSciBench representa uma mudança significativa na forma como avaliamos IA para ciências da vida. Em vez de perguntas de trivia biológica, ele testa se os modelos conseguem raciocinar como cientistas: analisar evidências, projetar experimentos, interpretar resultados ambíguos e comunicar descobertas.

    Com 36,1% de aprovação do melhor modelo, o benchmark está longe de ser saturado. Isso significa que há espaço real para avanços — e o LifeSciBench servirá como régua para medir o progresso da IA nas biociências nos próximos anos.


    O paper completo e detalhes técnicos estão disponíveis no site do LifeSciBench.

  • Google Vids: como criar vídeos profissionais com avatares de IA sem custo

    Google Vids: como criar vídeos profissionais com avatares de IA sem custo

    O Google acaba de anunciar grandes novidades para o Google Vids, sua ferramenta de criação de vídeos com inteligência artificial integrada ao Workspace. Com os novos avatares de IA, narrações por voz sintética e geração automática de roteiros, qualquer pessoa com uma conta Google nos EUA já pode criar vídeos profissionais — sem custo adicional. O lançamento será expandido para outras regiões nos próximos meses.

    A promessa é ambiciosa: eliminar a barreira da produção de vídeo corporativo, que historicamente exige equipamento caro, horas de gravação e softwares complexos. Com o Google Vids, bastam alguns cliques para transformar apresentações, pitches de vendas e demonstrações de produto em vídeos polidos com apresentadores digitais.

    Mais de 7 milhões de usuários já utilizam o Google Vids mensalmente. Veja como aproveitar os novos recursos em três cenários práticos.


    1. Transforme apresentações estáticas em vídeos dinâmicos

    Quem nunca assistiu a uma apresentação arrastada onde os pontos-chave simplesmente não grudam? E, como apresentador, você conhece a dor de ter que repetir o mesmo conteúdo para cobrir múltiplos fusos horários ou integrar novos membros da equipe.

    Com a nova integração com o Google Slides, você converte suas apresentações em vídeos escaláveis e envolventes com poucos cliques. O Vids cria automaticamente um storyboard a partir do seu conteúdo e gera um roteiro para um avatar de IA.

    Google Vids transforma Slides em vídeo com script

    Esses avatares atuam como apresentadores digitais e podem ser re-roteirizados a qualquer momento — se sua mensagem ou conteúdo precisar de atualização, basta ajustar o texto.

    Escolha entre diversos avatares de IA para narrar sua apresentação

    Para situações em que um avatar na tela não é necessário, você pode optar por uma narração por voz de IA. Em breve, será possível gerar narrações em 8 idiomas, incluindo japonês, coreano, espanhol e francês — ideal para alcançar audiências globais sem regravações.


    2. Crie pitches de vendas que escalam em múltiplos idiomas

    Fazer um pitch é uma arte que leva tempo para ser aperfeiçoada — e repetição para escalar. O Google Vids resolve ambos os problemas com vídeos que apresentam o rosto e a voz consistentes de um avatar de IA.

    Além de criar avatares personalizados com o logotipo da sua empresa e fundo customizado, a partir do final de junho você poderá controlar a emoção dos avatares. Isso permite ajustar a entrega da mensagem para combinar perfeitamente com a intenção do seu discurso — mais entusiasmo, urgência ou calma, conforme a necessidade.

    Controle emocional dos avatares de IA — lançamento previsto para final de junho

    Depois de ter o pitch perfeito, você pode escalá-lo globalmente gerando avatares e narrações a partir de roteiros escritos em 24 idiomas, incluindo árabe, hindi, holandês e vietnamita.


    3. Demonstre seu produto sem precisar de uma produção de vídeo

    Mostrar seu produto em ação é a melhor forma de educar clientes, mas demonstrações tradicionais são caras de produzir e notoriamente difíceis de manter atualizadas.

    Os avatares de IA removem esse custo de produção, e as novas melhorias dão ainda mais controle criativo. Agora você pode direcionar avatares personalizados para andar, falar e interagir com objetos — basta adicionar os elementos como “ingredientes” e digitar um prompt.

    Avatares de IA que andam, falam e interagem com objetos via prompt

    O melhor: agora é possível criar clipes de vídeo em alta fidelidade sem limite de duração, permitindo construir demonstrações completas do início ao fim, sem pressa e sem cortes forçados.


    Comece a criar hoje

    “Fiquei impressionado com a forma como o Vids transforma nossos decks de vendas em vídeos curtos de demonstração para clientes. Isso mudou completamente como personalizamos nosso alcance. O time de vendas acha que é mágica!”
    — Forest Donovan, Sr. Director of Strategic Alliances, Fullstory

    Pronto para fazer sua própria mágica? Comece agora mesmo acessando vids.new. Qualquer pessoa com uma conta Google nos EUA pode usar os avatares de IA sem custo — e a disponibilidade está chegando a outras regiões nos próximos meses.


    Fonte: Google Workspace Blog — David Nachum, Product Manager, Google Vids

  • Amazon Quick ganha agentes autônomos de IA e consultas cross-source

    Amazon Quick ganha agentes autônomos de IA e consultas cross-source

    A AWS anunciou uma grande expansão do Amazon Quick, seu assistente de análise de dados baseado em IA, com novos agentes autônomos que trabalham continuamente em nome dos usuários.

    Agentes autônomos no Quick

    Os novos agentes autônomos do Amazon Quick são capazes de executar tarefas de análise de dados de forma proativa, sem intervenção humana constante. Eles podem:

    • Monitorar métricas de negócio em tempo real
    • Detectar anomalias e padrões nos dados automaticamente
    • Gerar alertas quando condições específicas são atendidas
    • Preparar relatórios e dashboards de forma autônoma
    • Responder perguntas complexas consultando múltiplas fontes de dados

    Activity Feed inteligente

    Junto com os agentes, o Quick ganha um Activity Feed que ajuda a priorizar o trabalho mais importante. Este feed centraliza notificações, insights gerados por agentes e tarefas pendentes, funcionando como um hub de produtividade para analistas de dados.

    Consultas cross-source

    Outra novidade é a capacidade de fazer perguntas em linguagem natural que consultam todas as fontes de dados que a empresa utiliza — bancos SQL, data lakes, APIs, planilhas — a partir de uma única interface. Isso elimina a necessidade de alternar entre diferentes ferramentas de análise.

    Impacto para times de dados

    Com estas atualizações, o Quick se posiciona como uma plataforma de análise aumentada que vai além da simples geração de gráficos. Os agentes autônomos permitem que analistas foquem em tarefas estratégicas enquanto a IA cuida do monitoramento contínuo e da detecção de insights.

    A AWS afirma que a funcionalidade pode “devolver horas todos os dias” para equipes de dados, reduzindo drasticamente o tempo gasto em tarefas repetitivas de monitoramento e preparação de relatórios.

    Fonte: AWS Machine Learning Blog

  • AWS SageMaker AI agora suporta payloads inline na inferência assíncrona

    AWS SageMaker AI agora suporta payloads inline na inferência assíncrona

    A AWS anunciou uma atualização importante para o Amazon SageMaker AI Async Inference: agora é possível enviar os payloads de inferência diretamente no corpo da requisição da API InvokeEndpointAsync, sem a necessidade de fazer upload prévio para o Amazon S3.

    O que mudou?

    Antes deste anúncio, para usar inferência assíncrona no SageMaker AI, os clientes precisavam fazer o upload dos dados de entrada para um bucket S3 e depois referenciar esse local na chamada da API. Isso adicionava latência, complexidade de código e custos extras de armazenamento.

    Agora, os payloads podem ser enviados inline — ou seja, diretamente no corpo da requisição HTTP. O SageMaker AI gerencia o armazenamento temporário internamente, simplificando todo o fluxo.

    Como funciona?

    A nova funcionalidade suporta payloads de até 1 MB inline. Para cargas maiores, o upload via S3 continua sendo a abordagem recomendada. A API aceita os mesmos formatos de conteúdo de sempre: JSON, CSV, texto, imagens codificadas em base64, entre outros.

    Exemplo simplificado de chamada:

    aws sagemaker-runtime invoke-endpoint-async \
      --endpoint-name meu-endpoint \
      --content-type "application/json" \
      --body '{"inputs": "Exemplo de prompt"}'
    

    Por que isso importa?

    Este é mais um passo da AWS para reduzir a fricção no uso de modelos de IA em produção. Para times que fazem inferências de baixa latência com payloads pequenos (como classificação de texto, análise de sentimento, ou pequenas gerações de texto), a eliminação da etapa de upload S3 significa:

    • Menos código: sem gerenciar buckets, chaves e permissões S3
    • Menor latência: sem round-trip extra para upload
    • Custo reduzido: sem cobranças adicionais de S3 para armazenamento temporário

    A funcionalidade já está disponível em todas as regiões onde o SageMaker AI Async Inference é suportado.

    Fonte: AWS Machine Learning Blog