Tag: agentes de IA

  • Nous Research Lança Modo Blank Slate no Hermes Agent: Agente Mínimo com Controle Total

    Nous Research Lança Modo Blank Slate no Hermes Agent: Agente Mínimo com Controle Total

    A Nous Research acaba de lançar um novo modo de configuração para o Hermes Agent, seu framework open-source de agentes de IA auto-melhoráveis. Chamado de Blank Slate (“tela em branco”), o modo inverte a lógica tradicional de onboarding: em vez de um agente completamente carregado com todas as funcionalidades ativas, você começa com quase nada — e habilita apenas o que realmente precisa.

    O que é o Blank Slate

    Em uma instalação limpa, o comando hermes setup agora oferece três modos de configuração:

    • Quick Setup: usa o portal da Nous com login OAuth gratuito, sem necessidade de chaves API. É o caminho mais rápido e recomendado para iniciantes.
    • Full Setup: você percorre cada provedor, ferramenta e opção manualmente, fornecendo suas próprias chaves. Controle total.
    • Blank Slate (novo): o caminho mínimo. Apenas três componentes vêm ativados por padrão: provedor e modelo, File Operations (operações de arquivo) e Terminal. Todo o resto fica desabilitado.

    Tudo que começa desligado no Blank Slate: web, navegador, execução de código, visão computacional, memória, delegação, cron jobs, skills, plugins e servidores MCP. Compressão, checkpoints, roteamento inteligente e captura de memória também ficam fora.

    Por que o formato de configuração importa

    O Blank Slate não apenas alterna funcionalidades em tempo de execução — ele grava a decisão em disco. O modo escreve uma lista explícita em platform_toolsets.cli e outra em agent.disabled_toolsets. Juntas, essas duas chaves fixam a superfície do agente de forma permanente.

    O efeito é durável: nada que você deixou de fora será carregado depois, nem mesmo após um hermes update. Uma atualização não pode reativar silenciosamente um toolset que você desligou.

    A separação de responsabilidades também é clara: tokens e segredos ficam em ~/.hermes/.env, enquanto configurações não sensíveis vão para ~/.hermes/config.yaml. O CLI roteia cada valor para o arquivo correto.

    Casos de uso ideais

    Três cenários se beneficiam do Blank Slate:

    1. Ambientes de segurança restrita: quando você quer um agente sem acesso à web e sem navegador. O Blank Slate entrega apenas arquivos e terminal. Nada alcança a rede a menos que você adicione explicitamente.

    2. Times com configuração reprodutível: você fixa um toolset conhecido em todas as máquinas da equipe. Atualizações não introduzem surpresas — a superfície é idêntica em qualquer lugar.

    3. Desenvolvedores que constroem do zero: se você quer entender exatamente o que cada componente faz antes de ativá-lo, o Blank Slate é o ponto de partida ideal. Habilite skills, plugins e MCP à medida que cada necessidade surgir.

    Comparação entre os modos

    Modo Padrão ativo Autenticação Ideal para
    Quick Setup (Portal Nous) Modelo + Tool Gateway OAuth gratuito, sem API keys Primeira execução mais rápida
    Full Setup Todas as ferramentas (escolha manual) Suas próprias chaves Controle total e personalizado
    Blank Slate Provider, File Ops, Terminal Apenas auth do provider Segurança, minimalismo, reprodutibilidade

    Disponibilidade

    O Blank Slate está disponível agora no Hermes Agent. Para usar, execute hermes setup em uma instalação limpa e selecione a terceira opção. Se você já tem um agente rodando com Quick ou Full Setup, pode reconfigurar com hermes setup agent para ajustar toolkits individuais.

    A Nous Research continua expandindo o Hermes Agent como uma alternativa open-source robusta no ecossistema de agentes de IA — agora com ainda mais controle nas mãos do desenvolvedor.

  • NVIDIA usa agentes de IA para treinar robôs a instalar GPUs com 99% de sucesso

    NVIDIA usa agentes de IA para treinar robôs a instalar GPUs com 99% de sucesso

    Pesquisadores do laboratório GEAR (Generalist Embodied Agent Research) da NVIDIA, em colaboração com a Carnegie Mellon University e a UC Berkeley, desenvolveram o ENPIRE — um framework que permite que agentes de IA de código dirijam de forma autônoma o treinamento de robôs.

    O resultado? Robôs que aprenderam a instalar GPUs em placas-mãe, cortar abraçadeiras e organizar pinos com 99% de taxa de sucesso.

    Como funciona o ENPIRE

    O ENPIRE (harness de agente) envolve modelos de IA com quatro módulos principais: verificação e reset automático de tarefas, refinamento de políticas robóticas, avaliação paralela em múltiplos robôs físicos e análise de falhas com ingestão de artigos científicos para melhorar o código de treinamento.

    “Nós apenas lemos os relatórios pela manhã”, brincou Jim Fan, diretor de IA da NVIDIA, em um post no LinkedIn.

    O framework foi testado com três agentes de código diferentes: OpenAI Codex com GPT-5.5, Anthropic Claude Code com Opus 4.7 e Moonshot AI Kimi Code com Kimi K2.6.

    Equipes de agentes são melhores que agentes solo

    Um dos achados mais interessantes: times maiores de agentes produzem resultados mais rápidos. Uma equipe de oito agentes alcançou 99% de sucesso na tarefa Push-T em apenas duas horas, comparado a três horas com quatro agentes e quase cinco horas com um único agente.

    Na tarefa de inserção e organização de pinos, os agentes atingiram quase 100% de sucesso mais rápido que o método estado da arte com supervisão humana.

    Limitações importantes

    Os pesquisadores também identificaram gargalos significativos: os robôs frequentemente ficavam ociosos enquanto os agentes estavam ocupados “lendo logs, escrevendo código ou esperando o modelo de linguagem”. Times maiores gastavam mais tempo resumindo ideias uns dos outros.

    Além disso, o sucesso mais rápido veio com maior consumo de tokens — uma consideração importante em um momento em que empresas como Anthropic estão revisando seus modelos de precificação baseada em tokens.

    Código aberto e futuro

    A equipe da NVIDIA prometeu abrir o código do ENPIRE para que qualquer pessoa possa hospedar seu próprio “laboratório de robótica autônomo em casa”. O anúncio se alinha com a visão da NVIDIA para IA física, que inclui parcerias com a Unitree para robôs humanoides de referência e colaboração com a Hyundai para fabricação em massa de robôs com IA.

  • OpenAI quer transformar ChatGPT em agente pessoal; veja o que muda

    OpenAI quer transformar ChatGPT em agente pessoal; veja o que muda

    A OpenAI está preparando a maior reformulação do ChatGPT desde seu lançamento em 2022. Segundo o Financial Times, a empresa quer transformar o chatbot em um “superaplicativo” capaz de executar tarefas — não apenas responder perguntas.

    “O chat está morto”

    A frase dita por um funcionário sênior da empresa ao jornal britânico resume a virada de estratégia: o futuro não está em chatbots que respondem, mas em agentes que executam. A mudança antecede o IPO planejado para este ano e tem um endereço claro: clientes corporativos.

    Do chatbot ao agente pessoal

    A reformulação dará maior destaque ao Codex, produto de programação da OpenAI que já conta com mais de 5 milhões de usuários ativos semanais — crescimento de 6x desde o lançamento do app desktop em fevereiro.

    A empresa está implementando agentes de IA capazes de realizar múltiplas tarefas, como reservas de viagens e organização de calendários. A interface do ChatGPT será redesenhada para direcionar usuários a ferramentas de programação, geração de imagens e aplicativos parceiros como Canva e Booking.com.

    No longo prazo, a aposta é que os modelos entendam automaticamente a intenção do usuário, sem necessidade de navegar por menus:

    “O que estamos construindo é um sistema em que você terá seu próprio agente pessoal capaz de ajudá-lo em todos os aspectos da sua vida, seja pessoal ou profissional.” — Thibault Sottiaux, head de produtos da OpenAI

    Olho na receita corporativa

    As 2 milhões de empresas que usam produtos OpenAI respondem por aproximadamente 40% da receita, e a meta é chegar a 50% até o fim do ano. Para focar nisso, a empresa sacrificou projetos consumer: desativou compras dentro do ChatGPT e encerrou o Sora, ferramenta de geração de vídeos, em menos de um ano.

    Internamente, as equipes de ChatGPT, Codex e outros produtos foram unificadas sob Sottiaux, e executivos seniores deixaram a empresa, incluindo o ex-chefe de produto Kevin Weil.

    Convergência com a Anthropic

    A estratégia aproxima a OpenAI de sua principal rival. A Anthropic, com o Claude Code, sempre priorizou o mercado corporativo.

    “Há um ano, a OpenAI mirava alto e a Anthropic queria gerar lucro primeiro. Agora os dois estão convergindo, porque ambos buscam um IPO e os investidores se importam mais com dinheiro do que com sonhos.” — Jenny Xiao, sócia da Leonis Capital e ex-pesquisadora da OpenAI

    Um agente para tudo

    A visão de longo prazo da OpenAI é ambiciosa: a distinção entre chatbots, ferramentas de programação e buscadores vai desaparecer.

    “Quando tivermos inteligência artificial geral, provavelmente haverá uma única entidade com a qual poderei conversar e que poderá fazer tudo o que eu precisar.” — Alex Embiricos, chefe de produtos corporativos da OpenAI

    A transformação do ChatGPT em agente pessoal marca uma nova fase da corrida da IA: menos conversa, mais ação.


    Fonte: Exame, via Financial Times

  • Endava revoluciona entrega de software com agentes de IA e ChatGPT Enterprise

    Endava revoluciona entrega de software com agentes de IA e ChatGPT Enterprise

    Endava adota agentes de IA para acelerar entrega de software

    A empresa global de tecnologia Endava está redesenhando seus processos de desenvolvimento e entrega de software ao incorporar agentes de inteligência artificial (IA), incluindo o ChatGPT Enterprise e o Codex, em suas operações. Essa iniciativa visa acelerar ciclos de desenvolvimento, automatizar fluxos de trabalho e fomentar uma cultura nativa de IA em toda a organização.

    Contexto e motivação para a transformação digital

    Com o aumento da complexidade dos projetos e a demanda por soluções ágeis, a Endava identificou na IA uma ferramenta estratégica para otimizar suas entregas. A utilização de agentes de IA permite que equipes de desenvolvimento deleguem tarefas repetitivas e de suporte, liberando tempo para foco em atividades de maior valor agregado.

    Como a Endava integra ChatGPT Enterprise e Codex no dia a dia

    • ChatGPT Enterprise: usado para comunicação interna, suporte técnico e geração de documentação, facilitando a colaboração entre times.
    • Codex: implementado para acelerar a escrita de código, sugerir trechos e automatizar testes, reduzindo erros humanos e aumentando a produtividade.
    • Agentes de IA personalizados: desenvolvidos para automatizar fluxos de trabalho específicos, integrando-se a sistemas existentes e monitorando processos em tempo real.

    Impacto no mercado e estratégias futuras

    Ao incorporar essas tecnologias, a Endava não apenas melhora a eficiência interna, mas também posiciona-se como uma referência na transformação digital orientada por IA. O movimento reflete uma tendência crescente do mercado de software, onde empresas buscam integrar inteligência artificial para acelerar inovação e entregar valor com mais rapidez.

    Além disso, a cultura AI-native fomentada pela Endava estimula a experimentação e o aprendizado contínuo, preparando a organização para as próximas ondas de evolução tecnológica.

    A parceria da Endava com as soluções da OpenAI, como ChatGPT Enterprise e Codex, demonstra como a inteligência artificial pode ser um catalisador para a modernização dos processos de desenvolvimento de software. Essa transformação traz ganhos tangíveis em produtividade e qualidade, além de fortalecer a posição competitiva da empresa no mercado global.

    Links úteis

  • Amazon SageMaker AI lança fine-tuning avançado para melhorar a precisão de chamadas de ferramentas em agentes de linguagem

    Amazon SageMaker AI lança fine-tuning avançado para melhorar a precisão de chamadas de ferramentas em agentes de linguagem

    Nova funcionalidade para aprimorar agentes de IA com Supervised Fine-Tuning e Direct Preference Optimization

    A Amazon Web Services (AWS) anunciou uma solução integrada no Amazon SageMaker AI que permite melhorar significativamente a precisão na seleção de ferramentas por agentes baseados em pequenos modelos de linguagem (SLMs). Utilizando as técnicas de Supervised Fine-Tuning (SFT) e Direct Preference Optimization (DPO) em conjunto, essa novidade facilita o treinamento e a otimização de agentes para que eles escolham corretamente as ferramentas necessárias para executar tarefas complexas, reduzindo erros e aumentando a eficiência.

    Por que a precisão em tool-calling é essencial para agentes de IA?

    Agentes de IA que realizam tarefas complexas dependem da capacidade de chamar as ferramentas certas para acessar informações ou executar ações. Quando um agente escolhe a ferramenta incorreta, erra parâmetros ou interrompe fluxos de trabalho, isso resulta em aumento do tempo para concluir tarefas, elevação das taxas de erro, maiores custos de suporte e pior experiência para o usuário final. Com a adoção crescente de agentes autônomos em ambientes produtivos, garantir que eles selecionem corretamente as ferramentas tornou-se fundamental para automação confiável.

    Como funcionam SFT e DPO no Amazon SageMaker AI?

    Supervised Fine-Tuning (SFT) consiste em ajustar o modelo com um conjunto de dados de alta qualidade, que oferece exemplos explícitos de como ele deve interagir com ferramentas específicas, reconhecendo nuances de linguagem e comandos. Já o Direct Preference Optimization (DPO) incorpora feedback humano ou objetivos pré-definidos diretamente no loop de treinamento, alinhando a saída do modelo às preferências desejadas sem a complexidade dos métodos tradicionais de aprendizado por reforço.

    Essa combinação permite um refinamento robusto dos modelos, tornando-os mais aptos a gerar respostas adequadas e executar chamadas de ferramentas com maior acurácia, tudo isso utilizando a infraestrutura gerenciada do SageMaker AI, que automatiza o provisionamento de recursos e o gerenciamento do ambiente de treinamento.

    Quem pode utilizar e como acessar essa funcionalidade?

    Desenvolvedores, cientistas de dados e equipes de machine learning que já utilizam o Amazon SageMaker podem aproveitar essas técnicas para aprimorar seus agentes de linguagem. É necessário possuir uma conta AWS, configurar permissões com IAM e preparar o ambiente para execução dos jobs de treinamento, que podem ser realizados em instâncias otimizadas para GPU, como a ml.p4d.24xlarge.

    O processo pode ser iniciado diretamente no console do SageMaker ou via SDKs, com integração para notebooks Jupyter no SageMaker Studio. O código de exemplo, incluindo scripts para SFT e DPO, está disponível no repositório oficial da AWS no GitHub (link para o repositório).

    Configuração e treinamento: passos essenciais

    1. Preparar o ambiente AWS com permissões IAM e configurar AWS CLI.
    2. Clonar o repositório com os scripts e datasets de exemplo.
    3. Utilizar o dataset When2Call, da NVIDIA, para treinar o modelo com exemplos de chamadas corretas e incorretas de ferramentas.
    4. Executar o fine-tuning supervisionado (SFT) para ajustar o modelo base Qwen3-1.7B.
    5. Aplicar o Direct Preference Optimization (DPO) para refinar o modelo com base em preferências explícitas.
    6. Monitorar métricas e realizar avaliações comparando o modelo base com as versões ajustadas.

    Todo o treinamento é realizado em jobs gerenciados pelo SageMaker AI, que suporta clusters multi-GPU e multi-nó, além de integração com MLflow para rastreamento e análise dos experimentos.

    Impacto prático para empresas e desenvolvedores

    Com essa funcionalidade, empresas que desenvolvem agentes conversacionais ou sistemas automatizados ganham maior controle sobre a qualidade das interações, reduzindo falhas causadas por chamadas incorretas de ferramentas. Isso melhora a experiência do usuário, otimiza processos internos e reduz custos operacionais relacionados a erros e suporte.

    A disponibilidade de uma solução gerenciada e escalável no SageMaker AI torna o processo de fine-tuning mais acessível, permitindo que equipes foquem em melhorar a lógica e o desempenho dos agentes, sem se preocupar com a complexidade da infraestrutura.

    Preços e limites

    Os custos associados ao uso do SageMaker AI para notebooks e jobs de treinamento variam conforme a configuração das instâncias e o tempo de uso. A AWS disponibiliza uma página detalhada com a tabela de preços do SageMaker AI. É importante verificar também as cotas de serviço para garantir a disponibilidade das instâncias necessárias, que podem ser consultadas no AWS Service Quotas.

    Links úteis para começar

  • Microsoft aposta em inteligência artificial sem limites e apresenta novas ferramentas para agentes de IA

    Microsoft aposta em inteligência artificial sem limites e apresenta novas ferramentas para agentes de IA

    Microsoft redefine sua estratégia de IA com foco em agentes e inteligência sem medição

    Na conferência Microsoft Build 2026, realizada em San Francisco, a gigante da tecnologia apresentou uma guinada estratégica significativa no mercado de inteligência artificial (IA). Após o fim da parceria exclusiva com a OpenAI, a Microsoft busca se reposicionar como uma plataforma robusta para desenvolvedores corporativos construírem e implantarem agentes de IA em seu ecossistema de nuvem.

    Dispositivos e modelos para acelerar o desenvolvimento de agentes

    Um dos destaques do evento foi o lançamento do Surface RTX Spark Dev Box, um computador desktop voltado para desenvolvedores que permite rodar agentes pessoais e modelos de IA localmente, sem depender exclusivamente da nuvem. Essa iniciativa está alinhada com o conceito de “unmetered intelligence” (inteligência sem medição), conforme explicado pelo CEO Satya Nadella, que visa liberar a capacidade dos agentes de IA para operar diretamente nas máquinas dos usuários, com maior autonomia e velocidade.

    Imagem relacionada ao artigo de AI Business
    Imagem de apoio da materia original.

    Além do hardware, a Microsoft introduziu uma nova família de modelos de IA, chamada MAI, que inclui:

    • MAI Thinking One: primeiro modelo de raciocínio da Microsoft, com 35 bilhões de parâmetros e janela de contexto de 128 mil tokens, otimizado para instruções complexas, raciocínio de múltiplos passos e geração de código.
    • Modelos para geração de texto para imagem, imagem para imagem e voz, integrados a aplicativos como PowerPoint e OneDrive.

    Foco em ferramentas para criação rápida e segura de agentes corporativos

    A Microsoft busca entregar às empresas um caminho completo para a criação, implantação e controle de agentes de IA. Para isso, lançou modelos on-device como o Aion 1.0 Instruct (modelo de linguagem leve para inteligência textual), Aion 1.0 Plan (para raciocínio e orquestração de workflows locais) e Phi Silica (voltado para gerenciamento de tarefas no Windows, especialmente em PCs com Copilot+).

    Complementando o ecossistema, a empresa anunciou o Microsoft Execution Containers, uma camada no sistema operacional que permite criar ambientes isolados e seguros para execução dos agentes, garantindo que as políticas e restrições definidas pelas organizações sejam respeitadas. Essa solução também suporta o framework OpenClaw, originalmente desenvolvido para Mac OS e agora integrado ao OpenAI, que possibilita controlar onde e como os agentes pessoais são executados.

    Imagem relacionada ao artigo de AI Business
    Imagem de apoio da materia original.

    Outro lançamento importante é o Microsoft Scout, assistente pessoal de IA baseado no OpenClaw, que se integra ao Microsoft 365, incluindo Outlook, Teams e OneDrive, ampliando a produtividade dos usuários com agentes inteligentes.

    Contexto e impacto para o mercado de IA empresarial

    Com a ruptura da exclusividade com a OpenAI, a Microsoft adotou uma estratégia de maior independência e diversificação, investindo também na Anthropic, concorrente da OpenAI, e incorporando seus modelos Claude ao ecossistema Copilot. Essa movimentação reflete a crescente demanda do mercado por soluções flexíveis e agnósticas em relação a modelos de IA.

    Segundo analistas, atrair desenvolvedores para construir agentes de IA é uma peça-chave para dominar o mercado emergente de “agentic AI” — agentes autônomos que executam tarefas complexas e interagem com sistemas corporativos. A Microsoft se posiciona para oferecer todo o stack tecnológico, desde hardware até frameworks e ambientes seguros, facilitando a adoção e escalabilidade dessas soluções.

    Próximos passos e desafios

    Embora a Microsoft tenha demonstrado capacidade de inovar com seus próprios modelos e ferramentas, o desafio agora é provar a eficácia e a integração desses agentes no dia a dia das aplicações empresariais. A expectativa é que, com o avanço das soluções anunciadas, empresas possam criar agentes personalizados, seguros e eficientes, reduzindo a dependência da nuvem e ganhando maior controle sobre seus processos automatizados.

    Links úteis

  • Robinhood Lança Negociação com Agentes de IA e Revoluciona o Mercado Financeiro

    Robinhood apresenta agentes de IA para negociações e cartão de crédito

    A plataforma de investimentos Robinhood lançou recentemente um recurso inovador que permite aos usuários realizar negociações por meio de agentes de inteligência artificial (IA) e também oferece um cartão de crédito com funcionalidades agentic. Essa novidade, anunciada em maio de 2026, representa um avanço significativo, especialmente por ocorrer em um setor altamente regulado como o financeiro.

    Como funcionam os agentes de negociação da Robinhood?

    O recurso Agentic Trading está atualmente em fase beta e permite que os usuários criem contas separadas para agentes de IA, vinculando-os a uma carteira dedicada dentro da plataforma. Cada operação realizada pelos agentes gera notificações push em tempo real, e os investidores podem acompanhar métricas detalhadas de lucro e prejuízo, além de visualizar previamente as ordens diretamente pelo aplicativo Robinhood.

    Imagem relacionada ao artigo de AI Business
    Imagem de apoio da materia original.

    Cartão de crédito com agente de IA

    Além da negociação, o Agentic Credit Card oferece aos usuários do Robinhood Gold Card a possibilidade de conectar seus agentes de IA a um cartão virtual com limite personalizado de gastos. Este agente é capaz de navegar na internet, realizar compras e até fazer reservas em nome do usuário, ampliando as funcionalidades da IA para além do mercado de ações.

    Disponibilidade e integração com sistemas terceiros

    Os agentes de IA da Robinhood não são limitados apenas ao sistema nativo da empresa. Usuários podem integrar agentes desenvolvidos por terceiros, como o Anthropic Claude, para gerenciar suas operações. Essa abertura favorece a personalização e o uso de tecnologias avançadas, mantendo a flexibilidade para diferentes perfis de investidores.

    Impacto prático para usuários e para o mercado financeiro

    Segundo o analista Lian Jye Su, da Omdia (divisão da Informa TechTarget), o foco da Robinhood é simplificar o processo de negociação, tornando-o mais acessível e intuitivo. A adoção de agentes de IA por uma plataforma tão relevante pode incentivar outras instituições financeiras, como Fidelity, Vanguard, Wells Fargo e Goldman Sachs, a implementarem sistemas semelhantes.

    Imagem relacionada ao artigo de AI Business
    Imagem de apoio da materia original.

    Esse movimento sinaliza que a infraestrutura de agentes de IA já está madura para operar em ambientes regulados, graças a protocolos como o Agent Payments Protocol, lançado pelo Google em 2025, e o protocolo x402, apoiado por Cloudflare e Coinbase, que permitem que agentes autorizem e executem pagamentos de forma autônoma.

    Riscos e segurança

    Apesar das vantagens, a Robinhood precisará investir fortemente em segurança para proteger todo o processo de negociação via agentes de IA. Ainda assim, essa iniciativa é vista como um marco, comparável a momentos decisivos na popularização de tecnologias disruptivas, como o ChatGPT.

    O futuro da negociação automatizada

    O sucesso da Robinhood pode levar a uma mudança de paradigma no mercado financeiro, com investidores utilizando agentes de IA para obter dicas, realizar análises e executar operações de forma mais eficiente. A expectativa é que a interação com agentes de IA se torne tão comum quanto o uso de assistentes de codificação baseados em IA, ampliando o engajamento dos usuários nas plataformas de investimento.

    Links úteis

  • Google I/O 2026: principais diálogos sobre avanços em IA, computação quântica e criatividade

    Durante o Google I/O 2026, o palco Dialogues reuniu líderes do Google, cientistas e visionários para discutir as inovações tecnológicas que estão moldando a sociedade e o futuro da inteligência artificial (IA).

    Visão do CEO Sundar Pichai sobre as novidades do evento

    Sundar Pichai, CEO da Alphabet e Google, conversou com Matt Berman, fundador do Future Forward, para detalhar a visão estratégica por trás dos principais anúncios do I/O 2026. A conversa destacou como a IA está integrada em diversos produtos e serviços, reforçando a missão da empresa de tornar a tecnologia acessível e útil para todos.

    Agentes de IA proativos transformam a produtividade

    Especialistas do Google, como Josh Woodward, Koray Kavukcuoglu, Liz Reid e Jeff Dean, participaram de um painel com Logan Kilpatrick para explorar como agentes de IA proativos estão revolucionando a forma como as pessoas trabalham. Esses agentes são capazes de antecipar necessidades, automatizar tarefas complexas e aumentar a eficiência em ambientes profissionais.

    Interseção entre computação quântica e inteligência artificial

    Hartmut Neven e James Manyika discutiram a convergência da computação quântica com a IA, destacando o potencial dessas tecnologias para acelerar pesquisas e resolver problemas antes considerados intratáveis. Essa combinação promete avanços significativos em áreas como otimização, simulação e aprendizado de máquina.

    IA aplicada à ciência: soluções para desafios complexos

    Demis Hassabis, CEO do Google DeepMind, conversou com Mike Allen, do Axios, sobre o papel da IA na resolução de problemas científicos de alta complexidade. Exemplos incluem o desenvolvimento de novos medicamentos, a modelagem de processos biológicos e a análise de grandes volumes de dados experimentais.

    Robótica e inteligência artificial física

    Kanishka Rao, do Google DeepMind, e Alberto Rodriguez, da Boston Dynamics, debateram com Jacklyn Dallas, do NothingButTech, os avanços em IA incorporada a sistemas robóticos. A discussão abordou como o aprendizado e a autonomia estão impulsionando robôs capazes de interagir com o ambiente físico de forma mais sofisticada e segura.

    IA na criatividade e narrativa cinematográfica

    O diretor Doug Liman e os representantes da 30 Ninjas, Jed Weintrob e Julina Tatlock, participaram de uma conversa com Mira Lane, do Google, sobre o impacto da IA na expansão dos limites da narrativa audiovisual. A tecnologia está sendo usada para criar efeitos visuais inovadores, roteiros dinâmicos e experiências imersivas para o público.

    Assista aos diálogos completos

    Para quem deseja acompanhar todas as discussões do palco Dialogues do Google I/O 2026, os vídeos estão disponíveis no canal oficial do Google Developers no YouTube.

    Links úteis

  • Nvidia revela mercado de US$ 200 bilhões com CPU Vera para inteligência artificial agente

    Jensen Huang destaca nova oportunidade bilionária para Nvidia

    O CEO e fundador da Nvidia, Jensen Huang, anunciou durante a divulgação dos resultados financeiros trimestrais da empresa uma nova e promissora frente de negócios: CPUs especialmente desenvolvidas para agentes de inteligência artificial. Segundo Huang, trata-se de um mercado inédito estimado em US$ 200 bilhões, que a Nvidia pretende liderar com seu produto Vera.

    O papel do Vera na revolução da computação para IA

    Lançada em março de 2026, a CPU Vera foi projetada com foco exclusivo em agentic AI, ou seja, agentes inteligentes capazes de executar tarefas de forma autônoma. Diferentemente das CPUs tradicionais, que priorizam múltiplos núcleos para rodar várias aplicações simultaneamente, o Vera foca em processar tokens com máxima velocidade, uma característica fundamental para agentes que funcionam como pequenas estações de trabalho autônomas.

    Imagem relacionada ao artigo de TechCrunch AI
    Imagem de apoio da materia original.

    Huang explicou que, enquanto as GPUs continuam sendo essenciais para a parte “cognitiva” dos modelos de IA — o processamento pesado de dados e aprendizado —, os agentes dependem de CPUs para realizar suas tarefas específicas. Assim, o Vera abre espaço para um novo tipo de arquitetura computacional, adaptada às necessidades crescentes dessa tecnologia.

    Impacto no mercado e na estratégia da Nvidia

    Com a introdução do Vera, a Nvidia amplia sua atuação para além das GPUs, tradicionalmente dominadas por concorrentes como Intel e AMD. Huang destacou que, apesar da forte concorrência, inclusive de gigantes como Amazon Web Services, que recentemente firmou contrato para fornecer seus próprios chips de IA, a Nvidia já comercializou US$ 20 bilhões em CPUs Vera neste ano — um indicativo do potencial de crescimento.

    Segundo o CEO, a expansão dos agentes inteligentes deve ser exponencial. “O mundo tem um bilhão de usuários humanos, mas vamos chegar a bilhões de agentes, que funcionarão como PCs para esses usuários”, afirmou. Essa visão reforça a estratégia da Nvidia de se posicionar no centro da transformação tecnológica em IA e robótica.

    Parcerias e adoção do Vera

    Huang também revelou que todos os principais hyperscalers (grandes provedores de serviços em nuvem) e fabricantes de sistemas já estão colaborando com a Nvidia para implementar o Vera em suas infraestruturas. Essa movimentação reforça a importância do produto para o futuro da computação em nuvem e inteligência artificial.

    Contextualização do mercado de IA em 2026

    O anúncio ocorre em um momento em que a corrida por chips especializados para IA está mais acirrada, com empresas como Amazon, Meta e outras investindo pesado em desenvolvimento de hardware próprio. A aposta da Nvidia no Vera mostra uma tentativa de diversificar seu portfólio e manter sua liderança tecnológica diante dessas novas demandas.

    Links úteis

  • SocialReasoning-Bench: Avaliando a Capacidade de Agentes de IA em Defender os Interesses dos Usuários

    Por que avaliar o raciocínio social em agentes de IA?

    À medida que agentes de inteligência artificial assumem tarefas mais complexas em contextos sociais — como gerenciar agendas, negociar compras ou interagir com outros agentes —, torna-se essencial que esses sistemas tenham mais do que competência técnica: precisam demonstrar raciocínio social. Isso significa entender não apenas o que o usuário deseja, mas também as motivações, interesses e intenções dos outros envolvidos, além de saber quando revelar, proteger ou negociar informações.

    O que é o SocialReasoning-Bench?

    Desenvolvido pela Microsoft Research, o SocialReasoning-Bench é um benchmark criado para medir a capacidade dos agentes de IA de agir em prol dos melhores interesses do usuário em situações que envolvem negociação social. O teste foca em duas tarefas realistas e comuns:

    • Coordenação de Calendário: o agente gerencia a agenda do usuário e precisa negociar um horário para uma reunião com outro agente, que representa um terceiro interessado.
    • Negociação em Marketplace: o agente atua como comprador, negociando o preço de um produto com um agente vendedor.

    Esses cenários simulam o que na teoria econômica é chamado de relação principal-agente, em que o agente (IA) deve agir em nome do principal (usuário), mesmo que os interesses de terceiros sejam conflitantes.

    Métricas inovadoras para medir desempenho

    O benchmark não se limita a avaliar se a tarefa foi concluída, mas também como ela foi realizada, introduzindo duas métricas principais:

    1. Optimalidade do Resultado (Outcome Optimality): mede quanto valor o agente conseguiu garantir para o usuário, numa escala de 0 a 1, comparando o resultado alcançado com o melhor e o pior cenário possível para o usuário.
    2. Diligência (Due Diligence): avalia a qualidade do processo decisório do agente, comparando suas ações com as de uma política considerada razoável e competente, também numa escala de 0 a 1.

    Essas métricas juntas formam uma noção operacional do dever de cuidado do agente em relação ao usuário: um bom agente deve alcançar resultados favoráveis e seguir um processo cuidadoso e estratégico.

    Configuração experimental e modelos testados

    O estudo avaliou modelos de ponta como GPT-4.1, GPT-5.4, Claude Sonnet 4.6 e Gemini 3 Flash, usando dois tipos de prompts:

    • Prompt Básico: apenas descreve o papel e as ferramentas disponíveis para o agente.
    • Prompt Defensivo: inclui orientações explícitas para que o agente consulte todas as fontes possíveis e defenda os interesses do usuário com afinco.

    O agente contraparte, que representa o outro lado da negociação, foi sempre o Gemini 3 Flash com esforço médio de raciocínio, para garantir comparações justas.

    Principais descobertas

    1. Alta taxa de conclusão, mas resultados frequentemente subótimos

    Os agentes completam quase todas as tarefas com sucesso — reuniões são agendadas, negociações fechadas —, porém, na maioria das vezes, aceitam condições que não são as melhores para o usuário. Por exemplo, em coordenação de calendário, eles frequentemente aprovam horários menos desejados; em negociações, aceitam preços próximos ao limite máximo do usuário.

    2. O prompting defensivo melhora, mas não resolve o problema

    Orientar explicitamente os agentes para defender os interesses do usuário traz melhorias perceptíveis, especialmente para GPT-5.4, mas ainda deixa uma lacuna significativa para um desempenho confiável e consistente.

    3. Valor deixado na mesa

    Os resultados indicam que os agentes frequentemente cedem valor ao contraparte, especialmente no marketplace, onde a maioria dos acordos fica próxima ao pior cenário para o usuário (Outcome Optimality próxima de zero). No calendário, o desempenho é melhor, mas ainda assim abaixo do ideal.

    4. Diligência distingue entre sorte e habilidade

    Ao cruzar as métricas, percebe-se que alguns agentes alcançam bons resultados por sorte, sem seguir processos rigorosos, enquanto outros mostram diligência, mas ainda assim não conseguem bons resultados — indicando limitações na capacidade do modelo.

    Implicações para o uso real e futuros desafios

    À medida que agentes de IA ganham autonomia para agir em nome dos usuários em ambientes sociais complexos, é fundamental que eles incorporem raciocínio social robusto. O SocialReasoning-Bench revela que, embora a tecnologia atual seja capaz de concluir tarefas, ainda falta a esses sistemas a capacidade consistente de negociar e agir estrategicamente para maximizar o benefício do usuário.

    Esse desafio é análogo ao papel de profissionais como advogados ou consultores, que têm deveres éticos claros de cuidado e lealdade. Para que agentes de IA possam ser confiáveis delegados digitais, é necessário avançar no desenvolvimento de algoritmos capazes de raciocinar socialmente, avaliar riscos e agir com diligência.

    Links úteis

  • Conheça Bob, o Assistente de Codificação por IA da IBM que Revoluciona o Desenvolvimento de Software

    Bob: o novo assistente de codificação da IBM

    A IBM lançou recentemente Bob, um assistente de codificação por inteligência artificial que promete transformar o processo de desenvolvimento de software nas empresas. Apresentado na conferência Think 2026, Bob se destaca por automatizar diversas etapas do ciclo de vida do desenvolvimento, mantendo o controle nas mãos dos desenvolvedores humanos.

    Contexto e motivação por trás do lançamento

    Com mais de 115 anos de mercado, a IBM aposta no software de desenvolvimento como porta de entrada acessível para que grandes empresas adotem a IA em seus processos. O CEO da IBM, Arvind Krishna, destacou que a empresa já aplicou IA e automação internamente, gerando ganhos de produtividade da ordem de US$ 4 bilhões.

    Imagem relacionada ao artigo de AI Business
    Imagem de apoio da materia original.

    Bob surge como resposta da IBM a outras soluções de agentes de codificação baseadas em IA, como o Claude Code da Anthropic e o Codex da OpenAI. Porém, Bob diferencia-se por integrar múltiplos modelos de IA para realizar as tarefas de codificação, incluindo o próprio Claude da Anthropic, modelos open source da Mistral e a linha Granite, desenvolvida pela IBM.

    Como Bob atua na prática

    Segundo Venkat Venkatesan, gerente sênior na EY, que testou Bob em beta privado, o assistente funciona como um agente digital que colabora em todas as fases do desenvolvimento, similar ao conceito de pair programming — onde dois programadores trabalham juntos na mesma estação. Bob atua como um parceiro de trabalho digital, auxiliando e complementando as habilidades humanas.

    Impactos para o mercado e estratégias da IBM

    A IBM está expandindo sua oferta de IA generativa focando em ambientes híbridos e mainframes, onde mantém forte presença, especialmente em setores regulados como financeiro. Para isso, lançou 150 agentes pré-construídos na plataforma Watsonx Orchestrate, além de ampliar o Concert AIOps para operações mais inteligentes e integradas.

    Imagem relacionada ao artigo de AI Business
    Imagem de apoio da materia original.

    Essa estratégia de múltiplos modelos e foco em nichos específicos, como mainframes e nuvem híbrida, visa atender a clientes que valorizam segurança e privacidade, mantendo a IBM como referência confiável. Analistas destacam que mainframes continuam sendo um negócio lucrativo e não uma tecnologia obsoleta, o que reforça a aposta da IBM.

    Casos de uso e adoção em clientes

    Um exemplo prático é a SEI, empresa de serviços financeiros dos EUA, que trabalha com a IBM Consulting para desenvolver agentes de IA para operações baseadas em nuvem, substituindo sistemas antigos como OCR. O CTO Zachary Womack ressalta que o objetivo é reexaminar e reengenheirar fluxos de trabalho para incorporar IA de forma eficiente, adotando uma abordagem multi-modelo que inclui Watsonx, Claude e OpenAI.

    Outro destaque é a parceria com o ex-tenista André Agassi, que desenvolverá um aplicativo móvel de coaching esportivo baseado em IA Watsonx, previsto para lançamento ainda em 2026, demonstrando a versatilidade da tecnologia para além do setor corporativo.

    Links úteis

  • Cloudflare lança Agent Memory: serviço gerenciado de memória persistente para agentes de IA

    Cloudflare apresenta Agent Memory em beta privado

    A Cloudflare anunciou o lançamento do Agent Memory, um serviço gerenciado de memória persistente para agentes de inteligência artificial (IA), atualmente em beta privado. A novidade foi divulgada durante a Agents Week da empresa e promete revolucionar a forma como agentes de IA lidam com a retenção e recuperação de informações ao longo do tempo.

    Como funciona o Agent Memory

    Ao contrário de simplesmente inserir todas as informações no contexto imediato de uma conversa, o Agent Memory extrai memórias estruturadas das interações dos agentes e as armazena para recuperação sob demanda. O sistema utiliza uma arquitetura de recuperação paralela com cinco canais que combinam resultados por meio da técnica Reciprocal Rank Fusion (RRF), garantindo que apenas as informações relevantes sejam utilizadas em cada consulta.

    O processo de ingestão das memórias envolve duas passagens paralelas: uma ampla, que fragmenta o conteúdo em blocos de aproximadamente 10 mil caracteres, e outra detalhada, que foca em valores concretos, como nomes, preços e versões. Antes de armazenar, as memórias passam por oito verificações para classificação em quatro categorias principais: fatos, eventos, instruções e tarefas.

    Além disso, o Agent Memory oferece o recurso de perfis de memória compartilhados, permitindo que equipes de agentes acessem um conhecimento comum. Isso é especialmente útil para uniformizar convenções, decisões arquiteturais e conhecimento tácito dentro de times de desenvolvimento. A Cloudflare já utiliza internamente essa funcionalidade, por exemplo, para que um agente de revisão de código aprenda a evitar alertas repetitivos previamente ignorados pelos autores.

    Quem pode usar e como acessar

    Atualmente, o Agent Memory está disponível em beta privado para desenvolvedores que constroem agentes na plataforma da Cloudflare. Interessados podem entrar na lista de espera oficial para obter acesso.

    Impacto prático e diferenciais técnicos

    O lançamento do Agent Memory responde a desafios reais enfrentados por agentes de IA que operam por semanas ou meses em ambientes produtivos, onde a qualidade da memória tende a degradar com o aumento do contexto — fenômeno conhecido como “context rot”. Pesquisas indicam que modelos de linguagem funcionam melhor com um contexto menor, porém mais relevante, o que torna a memória um diferencial de qualidade e não apenas um recurso de armazenamento.

    De acordo com especialistas, o Agent Memory representa uma mudança de paradigma, onde a memória deixa de ser apenas uma característica do modelo de IA para se tornar uma infraestrutura crítica, com gerenciamento de ciclo de vida, verificação e isolamento.

    Entre os diferenciais técnicos do serviço estão a distribuição na borda (edge computing), integração com as primitivas de computação da Cloudflare (como Durable Objects, Vectorize e Workers AI) e a arquitetura de recuperação multi-canal. Para extração e classificação, a Cloudflare utiliza o modelo Llama 4 Scout (17B MoE), enquanto o modelo Nemotron 3 (120B MoE) é empregado exclusivamente na síntese das respostas.

    Concorrência e mercado

    O mercado de memórias para agentes de IA está crescendo e conta com concorrentes como Mem0, Zep, LangMem e Letta. O que distingue o Agent Memory da Cloudflare é sua forte integração com a infraestrutura de computação na borda e a capacidade de compartilhamento de memórias entre agentes, algo que potencializa a colaboração em equipes.

    Considerações para adoção

    Especialistas alertam para alguns cuidados ao adotar serviços de memória para agentes, como o risco de vendor lock-in e a dependência de modelos secundários para extração, que podem não estar sob controle total dos desenvolvedores. Recomenda-se o uso explícito da ferramenta de “lembrar” para fatos críticos e a separação clara entre histórico de conversas e fatos aprendidos na arquitetura dos agentes.

    Links úteis