OpenAI e Broadcom revelam Jalapeño, chip de inferência otimizado para LLMs

A OpenAI e a Broadcom anunciaram o Jalapeño, um chip de inferência otimizado para grandes modelos de linguagem (LLMs), marcando a entrada mais agressiva da OpenAI no mercado de hardware personalizado para inteligência artificial.

O chip, desenvolvido em parceria entre as duas empresas, foi projetado especificamente para executar inferência de modelos de IA em escala, com foco em eficiência energética e custo por token — dois dos maiores gargalos para a operação de modelos como o GPT-5 em produção.

O chip Jalapeño

Diferente das GPUs de uso geral da Nvidia que dominam o mercado atual, o Jalapeño é um ASIC (circuito integrado de aplicação específica) construído sob medida para as cargas de trabalho de inferência dos modelos da OpenAI. A Broadcom contribuiu com sua expertise em design de chips personalizados — a mesma que usa para clientes como Google (TPUs) e Meta.

O nome “Jalapeño” segue a tradição da OpenAI de batizar seus projetos com temas inusitados, e o chip representa uma mudança estratégica significativa: em vez de depender exclusivamente de fornecedores externos como a Nvidia, a OpenAI está construindo sua própria pilha de hardware.

Por que isso importa

O anúncio acontece em um momento em que a indústria de IA busca alternativas ao domínio da Nvidia no mercado de chips para IA, que controla cerca de 80% do mercado de aceleradores. Empresas como Google, Amazon e Microsoft já desenvolveram seus próprios chips (TPU, Trainium e Maia, respectivamente), e a OpenAI agora se junta a esse grupo.

A inferência — o processo de gerar respostas a partir de modelos já treinados — representa a maior parte dos custos operacionais de serviços como o ChatGPT. Um chip otimizado para essa tarefa específica pode reduzir significativamente os custos e a latência, permitindo que a OpenAI escale seus serviços de forma mais econômica.

Além disso, ter controle sobre o hardware dá à OpenAI mais flexibilidade para otimizar seus modelos para arquiteturas específicas, potencialmente resultando em ganhos de desempenho que não seriam possíveis com hardware de prateleira.

O contexto competitivo

A parceria OpenAI-Broadcom se junta a uma série de movimentos recentes no mercado de chips para IA. A Google continua expandindo sua família de TPUs, a Amazon desenvolve os chips Trainium e Inferentia para AWS, a Microsoft avança com seus aceleradores Maia, e a Meta trabalha em seu chip MTIA. A Qualcomm, por sua vez, acaba de adquirir a Modular por US$ 4 bilhões para expandir sua presença em data centers.

Disponibilidade

O Jalapeño será inicialmente implantado nos próprios data centers da OpenAI e, segundo fontes próximas ao projeto, poderá eventualmente ser oferecido a clientes enterprise através da plataforma Azure, parceira de nuvem da OpenAI. A produção em volume está prevista para começar no final de 2026.

OpenAI e Broadcom revelam Jalapeño, chip de inferência otimizado para LLMs | IA em Foco

O chip Jalapeño

Por que isso importa

O contexto competitivo

Disponibilidade

more posts:

Pesquisadores de IA Continuam Deixando o Google para Trabalhar em Rivais

IA Deveria Acabar com Empregos de Engenharia, Mas Novos Dados Mostram que São os Mais Resilientes

Fim da era ‘tokenmaxxing’: empresas correm para impedir que funcionários esgotem orçamentos de IA com tarefas simples