Anthropic lança Auto Mode para Claude: mais autonomia e menos supervisão em tarefas de codificação
A Anthropic anunciou no dia 24 de março de 2026 o lançamento do Auto Mode, um novo recurso para o Claude Code, seu modelo de linguagem focado em…
Guia Prático para Fine-Tuning por Reforço no Amazon Bedrock com APIs Compatíveis OpenAI
Em dezembro de 2025, a Amazon anunciou a disponibilidade do Reinforcement Fine-Tuning (RFT) no Amazon Bedrock, inicialmente para modelos Nova,…
Como reservar capacidade GPU para endpoints de inferência no SageMaker usando planos de treinamento
Introdução à reserva de capacidade GPU para inferência no SageMaker Executar inferência com grandes modelos de linguagem (LLMs) exige capacidade GPU…
AWS lança inferência desagregada com llm-d para otimizar desempenho e custo em LLMs
Inferência desagregada na AWS: inovação para modelos de linguagem em larga escala A AWS anunciou a integração da tecnologia llm-d, um framework open…
IBM lança Mellea 0.4.0 e as Granite Libraries para workflows de IA estruturados e seguros
A IBM Research acaba de anunciar o lançamento da versão 0.4.0 do Mellea, uma biblioteca open-source em Python para criação de programas generativos…
NVIDIA Nemotron 3 Super agora disponível no Amazon Bedrock: alta performance para aplicações de IA generativa
Novo modelo NVIDIA Nemotron 3 Super chega ao Amazon Bedrock A Amazon Web Services (AWS) anunciou a disponibilidade do NVIDIA Nemotron 3 Super como um…
Arena: o ranking imparcial que define os melhores modelos de IA financiado pelas próprias gigantes do setor
Com a rápida multiplicação dos modelos de inteligência artificial (IA) e a crescente concorrência no setor, surge uma questão crucial: como…
Como Avaliar Agentes de IA para Produção com Strands Evals: Guia Prático e Passo a Passo
A transição de agentes de inteligência artificial (IA) do protótipo para a produção apresenta desafios que os testes tradicionais não conseguem…
Nemotron 3 Nano 4B: Novo Modelo Compacto da NVIDIA para IA Local Eficiente
Apresentação do Nemotron 3 Nano 4BA NVIDIA, em parceria com a Hugging Face, lançou o Nemotron 3 Nano 4B, um modelo híbrido compacto e eficiente…
OpenAI lança GPT-5.4 mini e nano: versões ágeis para programação e uso intensivo de API
Novas versões compactas do GPT-5.4 focam em desempenho e eficiênciaA OpenAI anunciou o lançamento das versões GPT-5.4 mini e GPT-5.4 nano, variantes…
OpenAI anuncia GPT-4 Turbo com 128K de contexto e novas APIs para desenvolvedores no DevDay
Novidades apresentadas no OpenAI DevDay No evento DevDay, a OpenAI revelou uma série de atualizações importantes para desenvolvedores, incluindo o…
ConTextual: Novo benchmark para raciocínio multimodal em imagens com textos complexos
O que é o ConTextual? ConTextual é um novo conjunto de dados e benchmark criado por pesquisadores da Universidade da Califórnia em Los Angeles (UCLA)…