Skip to content
IA em Foco
  • IA
  • EMPRESAS
  • MERCADO
  • INOVAÇÃO

Tag: modelos-de-linguagem

Anthropic lança Auto Mode para Claude: mais autonomia e menos supervisão em tarefas de codificação

A Anthropic anunciou no dia 24 de março de 2026 o lançamento do Auto Mode, um novo recurso para o Claude Code, seu modelo de linguagem focado em…

Guia Prático para Fine-Tuning por Reforço no Amazon Bedrock com APIs Compatíveis OpenAI

Em dezembro de 2025, a Amazon anunciou a disponibilidade do Reinforcement Fine-Tuning (RFT) no Amazon Bedrock, inicialmente para modelos Nova,…

Como reservar capacidade GPU para endpoints de inferência no SageMaker usando planos de treinamento

Introdução à reserva de capacidade GPU para inferência no SageMaker Executar inferência com grandes modelos de linguagem (LLMs) exige capacidade GPU…

AWS lança inferência desagregada com llm-d para otimizar desempenho e custo em LLMs

Inferência desagregada na AWS: inovação para modelos de linguagem em larga escala A AWS anunciou a integração da tecnologia llm-d, um framework open…

IBM lança Mellea 0.4.0 e as Granite Libraries para workflows de IA estruturados e seguros

A IBM Research acaba de anunciar o lançamento da versão 0.4.0 do Mellea, uma biblioteca open-source em Python para criação de programas generativos…

NVIDIA Nemotron 3 Super agora disponível no Amazon Bedrock: alta performance para aplicações de IA generativa

Novo modelo NVIDIA Nemotron 3 Super chega ao Amazon Bedrock A Amazon Web Services (AWS) anunciou a disponibilidade do NVIDIA Nemotron 3 Super como um…

Arena: o ranking imparcial que define os melhores modelos de IA financiado pelas próprias gigantes do setor

Com a rápida multiplicação dos modelos de inteligência artificial (IA) e a crescente concorrência no setor, surge uma questão crucial: como…

Como Avaliar Agentes de IA para Produção com Strands Evals: Guia Prático e Passo a Passo

A transição de agentes de inteligência artificial (IA) do protótipo para a produção apresenta desafios que os testes tradicionais não conseguem…

Nemotron 3 Nano 4B: Novo Modelo Compacto da NVIDIA para IA Local Eficiente

Apresentação do Nemotron 3 Nano 4BA NVIDIA, em parceria com a Hugging Face, lançou o Nemotron 3 Nano 4B, um modelo híbrido compacto e eficiente…

OpenAI lança GPT-5.4 mini e nano: versões ágeis para programação e uso intensivo de API

Novas versões compactas do GPT-5.4 focam em desempenho e eficiênciaA OpenAI anunciou o lançamento das versões GPT-5.4 mini e GPT-5.4 nano, variantes…

OpenAI anuncia GPT-4 Turbo com 128K de contexto e novas APIs para desenvolvedores no DevDay

Novidades apresentadas no OpenAI DevDay No evento DevDay, a OpenAI revelou uma série de atualizações importantes para desenvolvedores, incluindo o…

ConTextual: Novo benchmark para raciocínio multimodal em imagens com textos complexos

O que é o ConTextual? ConTextual é um novo conjunto de dados e benchmark criado por pesquisadores da Universidade da Califórnia em Los Angeles (UCLA)…

← Previous
Next →
  • Ferramentas e Prática
  • Infraestrutura e Cloud
  • Notícias
  • Pesquisa e Inovação
  • Regulamentação e Ética