Home / Infraestrutura e Cloud / CoreWeave aposta na inferência para expandir seu papel no mercado de neoclouds

Infraestrutura e Cloud

CoreWeave aposta na inferência para expandir seu papel no mercado de neoclouds

2 de abril de 2026 20:12

A CoreWeave, empresa inicialmente focada em GPU-as-a-service e com forte ligação à Nvidia, está passando por uma nova transformação estratégica ao direcionar seus esforços para a inferência em inteligência artificial (IA), um dos segmentos que mais cresce atualmente no setor.

\n\n

O que é inferência e por que é estratégica para a CoreWeave?

Na cadeia de valor da IA, a inferência corresponde ao processo de utilizar modelos treinados para gerar respostas, tomar decisões ou realizar tarefas específicas a partir de dados de entrada. Diferente do treinamento, que consome mais recursos computacionais, a inferência é fundamental para monetizar aplicações de IA em tempo real, especialmente em agentes autônomos que executam raciocínios complexos e tarefas prolongadas.

Imagem relacionada ao artigo de AI Business — Imagem de apoio da materia original.

Chen Goldberg, vice-presidente executivo de produto e engenharia da CoreWeave, destacou em um encontro com a imprensa que os clientes da empresa — que incluem desde grandes fornecedores de IA generativa como OpenAI, Cohere e ElevenLabs, até corporações como Siemens, Mercado Livre, Salesforce e Databricks — buscam diversas formas de executar inferência para seus produtos e serviços.

\n\n

Expansão e foco em agentes autônomos

O aumento do interesse em IA agentiva, que envolve agentes autônomos capazes de realizar múltiplas consultas e completar tarefas complexas com base em raciocínio derivado de grandes modelos de linguagem, impulsiona a demanda por soluções de inferência eficientes e escaláveis. Essas aplicações abrangem áreas como desenvolvimento de código, engenharia, inteligência artificial física, atendimento ao cliente e descoberta de medicamentos.

\n\n

Otimização de GPUs e desempenho

A CoreWeave opera cerca de 40 data centers dedicados à IA, majoritariamente equipados com GPUs Nvidia. Recentemente, a empresa destacou seu desempenho em benchmarks independentes do MLPerf Training, utilizando a arquitetura Nvidia Grace Blackwell para rodar modelos avançados de raciocínio, como DeepSeek-R1 e o GPT-OSS-120B, versão menor e aberta do modelo da OpenAI.

Shadi Saba, diretor sênior de infraestrutura AI/ML da CoreWeave, explicou que a empresa utiliza uma pilha própria de software para maximizar o desempenho tanto de GPUs antigas quanto de CPUs, que têm ganhado relevância em tarefas de inferência. Essa estratégia ajuda a mitigar preocupações financeiras relacionadas à rápida obsolescência dos chips à medida que novas gerações são lançadas.

\n\n

Estratégia de portfólio e o mercado de neoclouds

Segundo o analista Steven Dickens, da HyperFrame Research, a abordagem da CoreWeave de combinar GPUs antigas que ainda geram receita com chips de última geração funciona como uma carteira de investimentos, equilibrando segurança e crescimento. Essa gestão otimizada do portfólio de hardware é uma característica essencial dos provedores de neocloud, que também inclui concorrentes como Nebius, Lambda, OVH e QumulusAI.

O mercado de neoclouds, que já teve cerca de 150 startups há 18 meses, está se consolidando em torno de cerca de 10 grandes players. Dickens prevê um cenário “winner-takes-most”, onde CoreWeave se posiciona como um dos nomes de destaque, mantendo espaço para outros provedores importantes.

\n\n

Links úteis

Matéria original na AI Business

White Papers & Reports AI Business

Biblioteca de Recursos AI Business

Marcado:agentes-autonomos CoreWeave data centers gpu inferencia inteligencia-artificial mercado de IA mlperf neocloud nvidia

tiago

CoreWeave aposta na inferência para expandir seu papel no mercado de neoclouds

O que é inferência e por que é estratégica para a CoreWeave?

Expansão e foco em agentes autônomos

Otimização de GPUs e desempenho

Estratégia de portfólio e o mercado de neoclouds

Links úteis

OpenAI adquire TBPN e reforça presença no mercado de mídia tecnológica

Google lança Flex e Priority: novas opções para equilibrar custo e confiabilidade na Gemini API

Deixe um Comentário Cancelar resposta

Featured Posts

iOS 27: os recursos práticos de IA que vão transformar seu iPhone além da Siri

Governo Trump força Anthropic a tirar modelos Fable 5 e Mythos 5 do ar: quem se beneficia?

Claude-Mem: a “memória infinita” que faz o Claude Code lembrar do que já fez

CoreWeave aposta na inferência para expandir seu papel no mercado de neoclouds

O que é inferência e por que é estratégica para a CoreWeave?

Expansão e foco em agentes autônomos

Otimização de GPUs e desempenho

Estratégia de portfólio e o mercado de neoclouds

Links úteis

OpenAI adquire TBPN e reforça presença no mercado de mídia tecnológica

Google lança Flex e Priority: novas opções para equilibrar custo e confiabilidade na Gemini API

Related Posts

Deixe um Comentário Cancelar resposta

Social Icons

Featured Posts