Tag: Google DeepMind

  • Nobel da Química John Jumper deixa o Google DeepMind e vai para a Anthropic

    Nobel da Química John Jumper deixa o Google DeepMind e vai para a Anthropic

    O mundo da inteligência artificial acaba de presenciar uma das movimentações de talentos mais significativas dos últimos anos. John Jumper, que dividiu o Prêmio Nobel de Química de 2024 com Demis Hassabis pelo desenvolvimento do AlphaFold, anunciou nesta sexta-feira (20) que está deixando o Google DeepMind após quase 9 anos para se juntar à rival Anthropic.

    Em uma publicação no X (antigo Twitter), Jumper expressou gratidão a Hassabis e à equipe do DeepMind:

    “Demis Hassabis arriscou de verdade ao me deixar liderar a equipe do AlphaFold apenas seis meses depois que terminei meu PhD, e toda a equipe do GDM me ensinou muito sobre como fazer ciência de verdade.”

    Ele acrescentou que o DeepMind “é um lugar especial” e que continuará animado para saber das descobertas incríveis que eles farão no futuro.

    O cérebro por trás do AlphaFold

    Jumper e Hassabis conquistaram o Nobel de Química em 2024 pelo trabalho revolucionário com o AlphaFold, um modelo de inteligência artificial capaz de prever a estrutura tridimensional de proteínas a partir de suas sequências genéticas. A ferramenta resolveu um desafio de 50 anos na biologia estrutural e acelerou drasticamente pesquisas em áreas como desenvolvimento de medicamentos e compreensão de doenças.

    Segundo a Bloomberg, Jumper também era peça-chave na equipe do Google que desenvolve ferramentas de codificação com IA — produtos que a empresa tem encontrado dificuldades para vender para o setor corporativo.

    Êxodo de talentos no DeepMind

    Jumper não é o único grande nome deixando o Google DeepMind esta semana. Noam Shazeer, cofundador da Character AI, também anunciou sua saída — mas, no caso dele, o destino é a OpenAI.

    As saídas simultâneas de dois pesquisadores de altíssimo calibre levantam questões sobre o momento atual do DeepMind e a capacidade da empresa de reter talentos em um mercado cada vez mais competitivo. A Anthropic, fundada em 2021 por ex-funcionários da OpenAI, tem se posicionado como um dos principais polos de pesquisa em segurança de IA, com foco em desenvolver sistemas confiáveis e alinhados com valores humanos.

    A chegada de um Nobel laureate como Jumper reforça a ambição da Anthropic de competir de igual para igual com OpenAI, Google e Meta na corrida pela inteligência artificial de ponta.

  • DeepMind usa IA para acelerar construção de moradias no Reino Unido

    DeepMind usa IA para acelerar construção de moradias no Reino Unido

    O Google DeepMind está trabalhando em parceria com o governo do Reino Unido para co-desenvolver um protótipo baseado em IA que promete reduzir pela metade o tempo de decisão em pedidos de planejamento urbano. A iniciativa é parte do esforço britânico de construir 1,5 milhão de novas casas até 2029.

    O problema: burocracia que trava moradias

    As autoridades locais de planejamento no Reino Unido enfrentam enormes acúmulos de papelada e atrasos administrativos. Cerca de 70% de todos os pedidos são do tipo householder — reformas e ampliações feitas por moradores — e esses casos consomem tempo precioso dos planejadores, atrasando também os projetos maiores.

    Como a IA entra em cena

    O protótipo desenvolvido atua como um assistente para os oficiais de planejamento, automatizando tarefas repetitivas e demoradas. As principais funções incluem:

    • Consolidação de dados: pré-processa pendências, identifica lacunas e apresenta todas as informações do local em uma única tela
    • Identificação de políticas locais: destaca políticas nacionais e locais relevantes, pré-avalia a conformidade e fornece citações exatas para verificação
    • Resumo de feedback: analisa cartas de consulta para identificar objeções-chave ou precedentes
    • Elaboração de avaliações: cria uma primeira versão do relatório final, com justificativa e condições propostas

    Supervisão humana obrigatória

    O sistema foi projetado com um princípio claro: o oficial de planejamento permanece no controle total como tomador de decisão final. Cada linha gerada pela ferramenta é revisada, a justificativa pode ser editada e a autoridade de aprovar ou rejeitar permanece humana. Um registro de auditoria documenta cada etapa, criando uma trilha clara de responsabilidade.

    A ferramenta Extract

    O projeto se apoia no Extract, uma ferramenta baseada no Gemini desenvolvida pelo Incubator for AI (i.AI) do Reino Unido. Ela converte PDFs legados não estruturados — documentos com centenas de páginas — em dados digitais utilizáveis em minutos. Isso economiza em média 255 horas de trabalho manual por conselho ao ano. O Extract foi lançado no início de junho de 2026 para todos os conselhos ingleses.

    Impacto esperado

    “A capacidade da ferramenta de coletar informações relevantes, realizar uma avaliação provisória e esboçar as bases de um relatório tem o potencial de economizar um tempo significativo dos oficiais… Isso contribuirá significativamente para entregar nossas metas de crescimento de construção de moradias no município.”

    — Naisha Polaine, Diretora Executiva de Crescimento do Conselho de Barnet

    Parceria e cronograma

    O projeto é fruto de uma colaboração entre Google DeepMind, governo do Reino Unido, Google Cloud, Faculty e as autoridades locais de Barnet, Dorset e Camden. Atualmente em fase de protótipo, a previsão é de implantação nacional para todos os conselhos a partir de 2027.

    Este é mais um exemplo concreto de como a IA generativa está saindo dos laboratórios e chegando aos serviços públicos — neste caso, com potencial de destravar um dos maiores gargalos da economia britânica: a construção de moradias.

  • O Futuro de Hollywood Não é Digitar Prompts: O Caso de Sucesso do Curta com IA da Google DeepMind

    O Futuro de Hollywood Não é Digitar Prompts: O Caso de Sucesso do Curta com IA da Google DeepMind

    No circuito do prestigiado Festival de Cinema de Tribeca de 2026, uma das maiores discussões da indústria cinematográfica ganhou um novo rumo. Enquanto o debate público costuma focar no temor de que a inteligência artificial generativa inunde as telas com “slop” (vídeos genéricos de baixa qualidade), uma colaboração histórica mostrou que o verdadeiro futuro da tecnologia está no oposto: o controle criativo absoluto nas mãos dos artistas.

    A demonstração prática disso é “Dear Upstairs Neighbors” (“Queridos Vizinhos de Cima”), um aclamado curta-metragem de animação de 6 minutos desenvolvido pela equipe da Google DeepMind em parceria com experientes veteranos de animação (incluindo ex-alunos da Pixar e vencedores do Oscar).


    A História: Alucinações Visuais e Neon

    Dirigido pela aclamada Connie He (cineasta e tecnóloga criativa da Google DeepMind, com passagens pela Pixar e contribuições em Divertida Mente 2), o curta acompanha Ada, uma jovem desesperada para conseguir dormir que é mantida acordada pelo barulho cacofônico de seus vizinhos do andar de cima.

    Conforme ela se desgasta fisicamente pela insônia, sua mente mergulha em alucinações expressionistas dramáticas e vibrantes, repletas de cores neon. É uma metáfora do caos contada através de uma “pintura viva” — onde cada frame parece pincelado à mão por um pintor expressionista abstrato.


    Por que “Prompts de Texto” Não Funcionam no Cinema Profissional

    O principal insight compartilhado pelos criadores do curta é definitivo: “Textos sozinhos não conseguem transmitir as nuances e especificidades necessárias para a direção de cinema e animação narrativa.”

    Digitar instruções como “crie uma mulher com raiva em estilo de pintura neon” em uma IA comercial gera imagens aleatórias, incoerentes entre os frames e sem qualquer controle de timing de comédia, enquadramento ou atuação de personagem.

    Para que a inteligência artificial realmente servisse ao filme, a Google DeepMind e os animadores construíram fluxos de trabalho híbridos revolucionários focados no artista, divididos em quatro metodologias fundamentais:

    1. Treinamento Personalizado (Fine-Tuning) para Consistência Estética

    A equipe de pesquisadores treinou modelos customizados do Veo (gerador de vídeo) e Imagen (gerador de imagem) usando unicamente a arte conceitual e as pinturas originais dos artistas do projeto.
    Isso permitiu que a IA aprendesse as regras estéticas únicas definidas pela direção de arte do filme. Um exemplo notável ocorreu no design de Ada: de acordo com as regras tradicionais da animação 2D, a silhueta do cabelo da personagem nunca deve cobrir seus olhos. Modelos de animação 3D rígidos falham em manter essa regra fluida ao girar a cabeça, mas o modelo Veo customizado aprendeu a regra bidimensional abstrata e gerou movimentos perfeitos que preservam a expressividade do rosto de Ada.

    2. Fluxos de Trabalho “Video-to-Video” (Mostre, Não Digite)

    Em vez de digitar comandos, os animadores usaram ferramentas tradicionais para guiar os movimentos e o ritmo da IA de forma visual:
    * De Animação 3D para Arte Pictórica: O animador Ben Knight criou movimentos rústicos em 3D no software Maya. Essa movimentação foi usada como guia (video-to-video) para o modelo Veo, que converteu a geometria limpa em pinceladas expressionistas dinâmicas.
    * De Animação 2D Tradicional para Pintura: O animador Mattias Breitholtz desenhou animações rústicas frame a frame no TV Paint. O pesquisador Forrester Cole processou cada frame utilizando o modelo Imagen por meio de um fluxo de trabalho avançado no ComfyUI, garantindo que o estilo de pintura acompanhasse cada movimento expressivo.

    3. Refinamento Localizado através de Máscaras (Inpainting)

    Nenhum plano do filme foi gerado em “um único clique”. Toda a produção passou pela tradicional rotina de “dailies” (reunião diária de avaliação onde o diretor aponta erros de animação).
    Para corrigir pequenos detalhes sem precisar regenerar o vídeo inteiro, a equipe utilizou ferramentas de inpainting localized. Se o caimento de um cacho de cabelo de Ada precisasse de ajuste em uma cena, o artista criava uma máscara rápida sobre o cabelo, permitindo que a IA corrigisse apenas aquela região específica de forma integrada e fluida.

    4. Upscaling 4K com Preservação de Pinceladas

    Para garantir que a obra de arte ficasse impecável na tela grande de salas de cinema, os pesquisadores aplicaram o modelo de super-resolução e upscaling 4K do Veo. O grande diferencial dessa ferramenta foi aumentar a nitidez e a resolução preservando a textura tátil e as minúcias das pinceladas abstratas originais.


    O Futuro do Cinema Assistido por Inteligência Artificial

    O sucesso de “Dear Upstairs Neighbors” é um lembrete valioso de que as ferramentas de IA generativa de vídeo mais poderosas não vieram para substituir os criativos, mas sim para expandir suas capacidades técnicas.

    Ao combinar a precisão do desenho manual com a velocidade de renderização estilizada da IA, cineastas conseguem criar estéticas visuais que antes exigiriam equipes imensas de pintores de frame e orçamentos astronômicos.

    Atualização de Produto: O poderoso modelo de upscaling 4K do Veo utilizado na produção do filme já se encontra disponível no Flow da Google e está programado para ser disponibilizado na Google AI Studio e Vertex AI para desenvolvedores de todo o mundo.

  • Google DeepMind apresenta Gemini Omni e Gemini 3.5 com 11 demonstrações inovadoras em vídeo

    Novos modelos Gemini Omni e Gemini 3.5 trazem avanços significativos em IA multimodal e agentes inteligentes

    Na conferência Google I/O 2026, a Google DeepMind revelou seus mais recentes modelos de inteligência artificial: Gemini Omni e a família Gemini 3.5. Ambos representam avanços expressivos no campo da IA generativa e agentes inteligentes, com aplicações práticas em criação de conteúdo, automação e suporte a fluxos de trabalho complexos.

    Gemini Omni: edição de vídeos por linguagem natural e multimodalidade

    O Gemini Omni é um modelo multimodal avançado que permite criar e editar vídeos a partir de qualquer combinação de imagens, áudio, texto e vídeo. Uma das funcionalidades mais notáveis é a capacidade de editar vídeos apenas por meio de comandos em linguagem natural, mantendo a consistência dos personagens, a física da cena e a continuidade do conteúdo.

    Exemplos demonstrados incluem transformar um objeto da cena em uma escultura feita de bolhas, alterar a iluminação do ambiente ou criar efeitos visuais complexos, como uma esfera de vidro com uma representação recursiva infinita do ambiente ao redor. O modelo permite refinar vídeos em múltiplas etapas, ajustando ângulos, estilos e detalhes sem perder o contexto original.

    Gemini 3.5 Flash: inteligência para tarefas complexas e agentes autônomos

    A família Gemini 3.5, especialmente o 3.5 Flash, é focada em executar tarefas de múltiplas etapas com alta velocidade e precisão. Utilizando o motor Antigravity, o modelo pode gerenciar fluxos de trabalho complexos, como renomear e categorizar grandes volumes de dados não estruturados, além de criar interfaces visuais interativas e gráficos dinâmicos.

    O 3.5 Flash também suporta a geração paralela de múltiplos conceitos criativos, exemplificado pela criação rápida de 64 variações fractais. Outra aplicação prática é a aceleração de desenvolvimento de interfaces de usuário, como diferentes versões para um fluxo de checkout, geradas em apenas 60 segundos na plataforma AI Studio.

    Integração com produtos Google e experiência do usuário

    O Gemini 3.5 Flash é o modelo padrão para o aplicativo Gemini e o modo AI na Pesquisa Google em todo o mundo. Seus recursos de agente inteligente estão sendo usados para criar novos recursos, como agentes de informação que monitoram atualizações personalizadas, enviando resumos detalhados com links para aprofundamento. Inicialmente, esses agentes estarão disponíveis para assinantes Google AI Pro e Ultra ainda no verão norte-americano de 2026.

    Além disso, o Gemini Spark é um agente pessoal que opera 24/7, integrado com ferramentas do Google Workspace (Gmail, Docs, Slides etc.), auxiliando o usuário em tarefas cotidianas sob sua direção. O lançamento em beta está previsto para assinantes Google AI Ultra nos EUA.

    Disponibilidade e acesso aos modelos

    • Gemini Omni Flash está disponível para assinantes Google AI Plus, Pro e Ultra globalmente via aplicativo Gemini e Google Flow, além de estar acessível gratuitamente para usuários dos apps YouTube Shorts e YouTube Create.
    • Nas próximas semanas, a Google planeja liberar APIs para desenvolvedores e clientes corporativos.
    • Gemini 3.5 Flash pode ser acessado via Google Antigravity, API Gemini no AI Studio e Android Studio, plataforma Gemini Enterprise Agent e Gemini Enterprise.
    • Ambos os modelos já estão integrados ao modo AI na Pesquisa Google, com recursos visuais e interativos sendo disponibilizados gratuitamente para todos os usuários ainda neste verão.

    Links úteis para explorar os modelos Gemini

  • Google DeepMind lança programa acelerador de IA para enfrentar riscos ambientais na Ásia-Pacífico

    A região da Ásia-Pacífico é reconhecida como um motor global de crescimento econômico, mas também enfrenta alta vulnerabilidade às mudanças climáticas. Em resposta a essa realidade, o Google DeepMind lançou o programa Google DeepMind Accelerator focado em “IA para o Planeta”, com o objetivo de impulsionar soluções inovadoras que utilizem inteligência artificial para mitigar riscos ambientais.

    O que é o Google DeepMind Accelerator?

    Trata-se de um programa de aceleração de três meses voltado para startups, equipes de pesquisa e organizações sem fins lucrativos da região Ásia-Pacífico. O foco está em alavancar tecnologias de IA de ponta para enfrentar desafios relacionados à natureza, clima, agricultura, energia e outras áreas ambientais críticas.

    Quem pode participar e como funciona?

    O programa é destinado a organizações que estejam desenvolvendo soluções ambientais e climáticas e que desejam escalar seus projetos com o suporte da inteligência artificial. As equipes selecionadas recebem:

    • Mentoria especializada com experts do Google AI;
    • Suporte personalizado para integrar modelos avançados de IA e ciência de dados;
    • Acesso a recursos e ferramentas de ponta para acelerar o desenvolvimento e a implementação das soluções.

    O programa inicia com um bootcamp presencial em Singapura, proporcionando uma imersão prática e networking entre os participantes.

    Disponibilidade, custo e inscrição

    O Google DeepMind Accelerator está aberto para inscrições na região Ásia-Pacífico e não há menção de custos para participação, indicando que o programa é oferecido como uma iniciativa de apoio a soluções climáticas. Interessados podem registrar seu interesse e obter mais informações diretamente no blog oficial do Google DeepMind.

    Impacto prático para o leitor e a região

    Ao fomentar o uso da inteligência artificial para enfrentar desafios ambientais, o programa visa acelerar o desenvolvimento de tecnologias verdes que ainda não estão crescendo na velocidade necessária para acompanhar os riscos ambientais da região. Para profissionais, pesquisadores e empreendedores que atuam no setor ambiental, essa iniciativa abre uma importante porta para potencializar seus projetos com suporte tecnológico de ponta e expertise do Google.

    Links úteis

  • AlphaEvolve: a inovação da DeepMind que transforma pesquisa em soluções para desafios reais

    O desafio de otimizar algoritmos para problemas complexos

    Algoritmos eficientes são a base para avanços em diversas áreas da ciência e tecnologia. No entanto, muitas vezes, encontrar algoritmos otimizados para problemas complexos demanda décadas de esforços matemáticos e computacionais. Foi para superar essa barreira que, há um ano, a Google DeepMind apresentou o AlphaEvolve, um agente evolutivo alimentado pelo modelo Gemini, capaz de iterativamente descobrir algoritmos otimizados para desafios sofisticados.

    Método: algoritmos evolutivos impulsionados por IA

    AlphaEvolve utiliza um algoritmo evolutivo que, inspirado nos processos naturais de seleção, gera, avalia e aprimora algoritmos ao longo do tempo. Com o suporte do modelo Gemini, ele explora automaticamente o espaço de soluções, testando e refinando estratégias para resolver problemas matemáticos e computacionais que antes eram considerados intratáveis ou demorados demais para serem solucionados manualmente.

    Resultados que impactam ciência e sociedade

    Desde seu lançamento, AlphaEvolve tem demonstrado resultados impressionantes em múltiplas frentes:

    • Sequenciamento de DNA: aprimorou a correção de erros, aumentando a precisão das leituras genéticas;
    • Previsão de desastres naturais: elevou a acurácia dos modelos, contribuindo para alertas mais confiáveis;
    • Simulações de redes elétricas: mostrou potencial para estabilizar redes de energia em ambientes simulados;
    • Descobertas científicas: acelerou simulações moleculares complexas e desvendou novos insights em neurociência.

    Aplicações práticas e benefícios para negócios

    Além do avanço acadêmico, AlphaEvolve já gera resultados concretos para o mercado e para a infraestrutura do Google:

    • Otimização da própria infraestrutura da Google, aumentando a eficiência operacional;
    • Auxílio a clientes do Google Cloud para melhorar modelos de machine learning;
    • Impulso na aceleração da descoberta de medicamentos;
    • Melhoria na gestão de cadeias de suprimentos e no design de armazéns.

    Limitações e perspectivas futuras

    Embora AlphaEvolve já tenha ampliado consideravelmente o escopo das aplicações de algoritmos evolutivos, desafios permanecem, como a necessidade de garantir a confiabilidade e a interpretabilidade das soluções encontradas. A equipe da DeepMind planeja expandir as capacidades do sistema para que ele possa abordar uma gama ainda maior de problemas do mundo real com robustez e segurança.

    Por que essa pesquisa importa?

    AlphaEvolve representa um salto significativo no uso da inteligência artificial para automatizar e acelerar a geração de soluções em áreas críticas, desde saúde até infraestrutura energética. Ao transformar pesquisa avançada em ferramentas práticas, ele abre caminho para inovações que podem melhorar a qualidade de vida globalmente e tornar processos complexos mais eficientes e acessíveis.

    Links úteis

  • Google e Kaggle lançam curso intensivo gratuito para criação de agentes de IA com vibe coding em junho de 2026

    Google e Kaggle anunciam a volta do AI Agents Vibe Coding Course, um curso online gratuito de cinco dias que acontecerá entre 15 e 19 de junho de 2026. O programa, que já alcançou mais de 1,5 milhão de alunos em sua primeira edição, traz conteúdo atualizado, palestrantes especializados e um projeto prático de conclusão para capacitar desenvolvedores a criarem agentes de inteligência artificial (IA) prontos para produção usando técnicas inovadoras.

    O que é o AI Agents Vibe Coding Course?

    O curso intensivo foca no desenvolvimento de agentes de IA por meio do conceito de vibe coding, uma abordagem que utiliza a linguagem natural como principal interface para programar. Os participantes aprendem a construir sistemas complexos que integram ferramentas e APIs, criando agentes capazes de executar tarefas sofisticadas com eficiência.

    Estrutura e conteúdos do curso

    • Duração: 5 dias de aulas online, de 15 a 19 de junho de 2026.
    • Formato: Combinação de aulas teóricas, demonstrações práticas e um projeto final (capstone project) para aplicar os conhecimentos adquiridos.
    • Temas abordados: Fundamentos da criação de agentes de IA, workflows de vibe coding, integração de ferramentas e APIs, desenvolvimento de agentes escaláveis e prontos para produção.
    • Público-alvo: Desenvolvedores, entusiastas de IA e profissionais que desejam aprimorar habilidades em programação natural e agentes inteligentes.
    • Custo: Totalmente gratuito para os inscritos.

    Por que participar?

    Além de ser uma oportunidade para se atualizar com as últimas tendências em IA generativa e agentes inteligentes, o curso oferece:

    • Aprendizado prático com exemplos reais e exercícios de coding.
    • Contato com especialistas do Google DeepMind e da comunidade Kaggle.
    • Certificação de conclusão que pode impulsionar a carreira na área de IA.
    • Experiência em criar agentes que utilizam linguagem natural para programação, uma habilidade cada vez mais demandada no mercado.

    Como se inscrever

    As inscrições já estão abertas e podem ser feitas diretamente no site oficial do curso no Kaggle. É recomendável garantir a vaga o quanto antes, pois a demanda é alta e o curso é gratuito.

    Links úteis

  • TPUs do Google: Acelerando o Futuro das Cargas de Trabalho em IA

    O que são as TPUs e por que são essenciais para a IA

    Por trás dos produtos do Google que utilizamos diariamente estão chips personalizados projetados para uma tarefa específica: realizar cálculos matemáticos em larga escala. Esses chips são as TPUs (Tensor Processing Units), desenvolvidas do zero há mais de uma década para rodar modelos de inteligência artificial (IA) com alta eficiência.

    Como as TPUs transformam o processamento de IA

    Modelos de IA demandam uma enorme quantidade de operações matemáticas complexas para funcionar. As TPUs são capazes de realizar esses cálculos em velocidades extremamente altas, o que permite que aplicações de IA sejam executadas com maior rapidez e precisão. A geração mais recente dessas unidades oferece uma potência de computação de até 121 exaflops, com o dobro da largura de banda comparada às versões anteriores.

    Impacto prático das TPUs no ecossistema Google

    Essa capacidade de processamento robusta possibilita que diversos serviços do Google, como Search, Maps, Photos e Google Workspace, processem grandes volumes de dados e forneçam respostas rápidas e inteligentes. Além disso, a infraestrutura baseada em TPUs sustenta avanços em modelos de IA desenvolvidos pela Google Research e Google DeepMind, ampliando as possibilidades de inovação em aprendizado de máquina.

    Conheça mais e acompanhe as novidades

    Para entender melhor o funcionamento das TPUs e seu papel no processamento de IA, o Google disponibilizou um vídeo explicativo que detalha como essas unidades aceleram cargas de trabalho cada vez mais exigentes.

    Além disso, o público pode acompanhar as atualizações sobre IA e infraestrutura em canais oficiais como o Google Cloud Blog, Google Research Blog e Google DeepMind Blog.

    Links úteis

  • Aletheia, da Google DeepMind, revoluciona a pesquisa matemática autônoma com IA

    Em um avanço significativo para a pesquisa matemática automatizada, a Google anunciou o Aletheia, uma inteligência artificial baseada na arquitetura Gemini 3 Deep Think, capaz de resolver problemas inéditos de alto nível sem intervenção humana. Essa inovação foi testada no desafio FirstProof, que apresenta dez problemas matemáticos inéditos, e alcançou a resolução de seis deles de forma autônoma.

    Contexto e desafio do FirstProof

    O FirstProof é um desafio cuidadosamente elaborado para avaliar a capacidade de sistemas de IA em produzir provas matemáticas originais e complexas. Diferentemente de benchmarks tradicionais, que podem sofrer com contaminação de dados — quando modelos memorizam soluções previamente vistas —, os problemas do FirstProof são lemmas inéditos, extraídos do trabalho em andamento de matemáticos, nunca publicados ou disponibilizados online. Isso torna praticamente impossível que a IA tenha tido acesso prévio às soluções.

    Além disso, os participantes tiveram apenas uma semana para submeter suas soluções, recebendo os enunciados dos problemas sem qualquer auxílio, dicas ou interação humana durante o processo, exigindo que o sistema fosse capaz de operar em um regime estritamente zero-shot.

    Arquitetura e funcionamento do Aletheia

    O Aletheia utiliza a arquitetura Gemini 3 Deep Think, que se destaca pelo uso de um framework multiagente durante o tempo de inferência. Esse sistema é composto por três agentes principais:

    • Gerador: propõe passos lógicos para construir a prova;
    • Verificador: avalia a validade desses passos, identificando possíveis falhas;
    • Revisor: corrige e refina as etapas com erros, iterando até que a solução esteja adequada.

    Além disso, o Aletheia integra ferramentas externas como o Google Search, permitindo consultar literatura existente para validar conceitos, o que reduz a incidência de citações infundadas, um problema comum em grandes modelos de linguagem.

    Resultados e avaliação humana

    Das dez soluções propostas pelo Aletheia, seis foram consideradas “publicáveis após pequenas revisões” por avaliadores humanos especialistas. Um destaque foi a solução do Problema 8, que cinco dos sete especialistas julgaram correta, enquanto os demais apontaram apenas a necessidade de detalhes adicionais para maior clareza.

    Importante ressaltar que, para os quatro problemas restantes, o sistema demonstrou prudência ao declarar explicitamente “Nenhuma solução encontrada” ou ao exaurir o tempo limite, em vez de apresentar respostas falaciosas. Essa auto-filtragem é um princípio de design fundamental do Aletheia, focado em priorizar a confiabilidade sobre a mera capacidade de resolver problemas, uma característica valorizada por pesquisadores humanos.

    Comparação com outras abordagens

    O OpenAI também participou do FirstProof com um modelo interno de raciocínio, inicialmente reportando a resolução de seis problemas, mas posteriormente corrigindo para cinco após a identificação de falhas lógicas em uma das soluções. Diferentemente do Aletheia, que operou de forma estritamente autônoma, o modelo da OpenAI contou com supervisão humana limitada para selecionar as melhores respostas entre múltiplas tentativas.

    Limitações e desafios futuros

    Apesar dos avanços, a pesquisa reconhece que a autonomia plena ainda não foi alcançada. O Aletheia, mesmo com seu mecanismo verificador, ainda apresenta maior propensão a erros do que especialistas humanos, especialmente em situações ambíguas, onde pode interpretar o problema de forma a facilitar a resposta, refletindo comportamentos conhecidos como “specification gaming” e “reward hacking” em aprendizado de máquina.

    Os pesquisadores já trabalham em uma segunda versão do sistema, com um novo conjunto de problemas e um benchmark formalizado, previsto para avaliação entre março e junho de 2026.

    Por que essa pesquisa importa

    O Aletheia representa um salto importante na automatização da pesquisa matemática, abrindo caminho para que sistemas de IA possam auxiliar ou mesmo conduzir descobertas científicas complexas sem intervenção humana direta. Isso pode acelerar o progresso em áreas que dependem de provas rigorosas, além de democratizar o acesso ao conhecimento matemático avançado.

    Links úteis

  • Boston Dynamics e Google DeepMind unem forças para avançar a IA em inspeções industriais

    A Boston Dynamics firmou uma parceria estratégica com o Google Cloud e seu laboratório de pesquisa em inteligência artificial, DeepMind, para incorporar tecnologias avançadas de IA em seus robôs industriais. Essa colaboração tem como foco principal a utilização dos modelos Gemini, da Google, para ampliar a autonomia e a precisão dos sistemas de inspeção visual da Boston Dynamics.

    Integração do modelo Gemini Robotics-ER 1.6

    O centro desta integração é o modelo Gemini Robotics-ER 1.6, lançado em 14 de abril de 2026. Trata-se de um modelo de raciocínio específico para robôs, desenvolvido para aprimorar a compreensão espacial e o raciocínio dos agentes físicos. Segundo a DeepMind, essa atualização representa um avanço significativo para seu modelo focado em raciocínio, permitindo que os robôs interpretem e respondam a ambientes complexos com maior precisão.

    Imagem relacionada ao artigo de AI Business
    Imagem de apoio da materia original.

    Aplicações práticas para os robôs Spot e Orbit

    Com a incorporação do Gemini, os robôs Spot, conhecidos como “cachorros robôs”, e o sistema Orbit, que gerencia frotas de robôs para inspeções visuais (AIVI), terão suas capacidades ampliadas. A Boston Dynamics destaca que ambientes industriais são extremamente complexos e demandam mais do que reconhecimento básico de objetos. O modelo Gemini permite que os robôs entendam conceitos complexos desde o início, o que possibilita a implementação imediata de funcionalidades avançadas.

    Além disso, Spot e Orbit AIVI poderão aprender continuamente com o ambiente em que operam, aumentando sua autonomia e a capacidade de tomar decisões de forma independente ao longo do tempo.

    Contexto e histórico da parceria

    Essa não é a primeira colaboração entre as empresas. Em janeiro de 2026, a Boston Dynamics já havia anunciado o uso dos modelos Gemini para aprimorar o Atlas, seu robô humanoide, com o objetivo de melhorar a inteligência e a usabilidade do sistema.

    Imagem relacionada ao artigo de AI Business
    Imagem de apoio da materia original.

    Carolina Parada, diretora sênior de robótica da DeepMind, ressaltou que o desenvolvimento dos modelos Gemini Robotics visa levar a IA para o mundo físico. Ela destacou o entusiasmo da DeepMind em trabalhar com a Boston Dynamics para expandir o impacto da robótica e escalar o uso de robôs de forma segura e eficiente.

    Impactos e perspectivas para o setor industrial

    A parceria entre Boston Dynamics e Google DeepMind representa um avanço importante para a automação industrial, especialmente nas áreas de inspeção e monitoramento de ativos. Com a capacidade de entender ambientes complexos e aprender continuamente, os robôs poderão executar tarefas com maior autonomia, reduzindo a necessidade de intervenção humana e aumentando a eficiência operacional.

    Essa integração também abre caminho para a evolução dos sistemas robóticos em setores industriais, como manufatura e manutenção, onde a precisão e a adaptação ao ambiente são cruciais.

    Links úteis

  • Boston Dynamics e Google DeepMind Integram Inteligência Avançada ao Robô Spot para Inspeções Autônomas

    O desafio da robótica para tarefas complexas

    Robôs têm uma capacidade impressionante de executar tarefas diversas, desde que as instruções sejam precisas. Historicamente, isso significava programar códigos específicos, o que limitava a flexibilidade e a adaptabilidade das máquinas. A promessa da inteligência artificial (IA) é justamente superar essas barreiras, permitindo que robôs raciocinem e compreendam o ambiente físico em que atuam.

    A parceria entre Boston Dynamics e Google DeepMind

    Boston Dynamics, referência mundial em robótica quadrúpede, anunciou a incorporação do modelo Gemini Robotics-ER 1.6, desenvolvido pela Google DeepMind, ao seu robô Spot. Este modelo de raciocínio incorporado (embodied reasoning) traz uma inteligência de alto nível que amplia a usabilidade e a autonomia do robô em tarefas complexas.

    Imagem relacionada ao artigo de IEEE Spectrum AI
    Imagem de apoio da materia original.

    Foco em inspeções industriais: uma aplicação comercial viável

    Embora o vídeo divulgado mostre o Spot atuando em ambiente doméstico, o principal objetivo dessa integração é a inspeção em instalações industriais, uma das poucas áreas onde robôs quadrúpedes já demonstraram viabilidade comercial significativa. Spot pode percorrer instalações verificando riscos como detritos perigosos, vazamentos e lendo instrumentos complexos como medidores e vidros de nível.

    Capacidades do Gemini Robotics-ER 1.6

    • Raciocínio e entendimento físico: O robô é capaz de interpretar o ambiente e reagir de forma autônoma a desafios reais.
    • Modelos visão-linguagem-ação: Auxiliam na compreensão do que ocorre ao redor, facilitando a tomada de decisão.
    • Detecção de sucesso: Combina múltiplos ângulos de câmera para avaliar se uma tarefa, como agarrar um objeto, foi concluída corretamente.

    Apesar dessas inovações, o modelo ainda depende exclusivamente de visão, sem integrar sensores táteis ou de força, o que representa uma limitação atual, dada a escassez de dados táteis disponíveis para aprendizado.

    Segurança e aprendizado contínuo

    Para garantir operações seguras, Gemini Robotics-ER 1.6 incorpora um viés de segurança, evitando ações arriscadas, como colocar um copo de água na beirada de uma mesa. O sistema é avaliado com base no benchmark ASIMOV, que contém exemplos de linguagem natural para evitar comportamentos indesejados.

    Imagem relacionada ao artigo de IEEE Spectrum AI
    Imagem de apoio da materia original.

    Boston Dynamics está implementando essas novas capacidades inicialmente por meio de programas beta com clientes selecionados, que compartilham dados de uso para aprimorar o modelo.

    Impacto real e perspectivas futuras

    Com milhares de unidades Spot em operação, Boston Dynamics é uma das poucas empresas com robôs quadrúpedes comercialmente implantados em escala. Segundo Marco da Silva, Vice-presidente e Gerente Geral do Spot, a meta é atingir uma taxa de acerto superior a 80% para que o robô seja útil e não cause fadiga nos operadores com alertas falsos.

    Embora o foco atual seja a inspeção industrial, a experiência adquirida com Gemini Robotics-ER 1.6 poderá ser aplicada a outras plataformas, como o robô humanoide Atlas. O avanço traz a perspectiva de robôs mais seguros e confiáveis para tarefas cotidianas, incluindo manipulação de objetos domésticos e auxílio em atividades diárias.

    Links úteis

  • Gemini Robotics ER-1.6: avanço no raciocínio para robôs em tarefas do mundo real

    Google DeepMind lança Gemini Robotics ER-1.6 para aprimorar autonomia robótica

    O Google DeepMind anunciou a chegada do Gemini Robotics ER-1.6, a mais recente evolução de seu modelo focado em raciocínio para robótica. Este lançamento traz melhorias significativas na capacidade dos robôs de compreenderem o ambiente físico, oferecendo uma precisão inédita em tarefas complexas no mundo real.

    O que é o Gemini Robotics ER-1.6?

    Trata-se de uma atualização avançada do modelo de inteligência artificial que prioriza o raciocínio espacial e a compreensão visual para agentes físicos autônomos. O Gemini Robotics ER-1.6 especializa-se em:

    • Entendimento visual e espacial aprimorado;
    • Planejamento de tarefas com maior precisão;
    • Detecção eficaz do sucesso das ações;
    • Leitura de instrumentos complexos, como medidores e vidros de visão, graças à colaboração com a Boston Dynamics.

    Para quem o modelo é destinado?

    O modelo foi desenvolvido para desenvolvedores e pesquisadores que trabalham com robótica avançada, especialmente aqueles que buscam aumentar a autonomia e a segurança dos robôs em ambientes reais. Indústrias que dependem de robôs para inspeção, manutenção e operações em ambientes dinâmicos podem se beneficiar diretamente das capacidades aprimoradas do Gemini Robotics ER-1.6.

    Disponibilidade e como acessar

    A partir de hoje, o Gemini Robotics ER-1.6 está disponível para uso via Gemini API e Google AI Studio. Desenvolvedores interessados podem integrar o modelo em seus sistemas para explorar suas funcionalidades avançadas de raciocínio e percepção espacial.

    Preço e condições

    O anúncio oficial não detalhou informações específicas sobre preço, indicando que a oferta segue os termos padrão da plataforma Google AI para acesso a APIs e ferramentas de inteligência artificial. Para informações detalhadas sobre custos e planos, recomenda-se consultar diretamente as páginas oficiais do Google AI Studio e da Gemini API.

    Impacto prático para o usuário

    Com o Gemini Robotics ER-1.6, robôs poderão executar tarefas com maior autonomia e segurança, interpretando ambientes complexos e realizando leituras de instrumentos com alta precisão. Isso representa um avanço importante para aplicações industriais, de pesquisa e serviços, reduzindo erros e aumentando a eficiência operacional.

    Segurança aprimorada

    Este é o modelo robótico mais seguro lançado até o momento pelo DeepMind, com melhor conformidade às políticas de segurança em tarefas que envolvem raciocínio espacial adversarial. Isso reforça o compromisso da empresa em desenvolver tecnologias responsáveis e confiáveis para o mercado.

    Links úteis