A OpenAI e a Broadcom anunciaram o Jalapeño, um chip de inferência otimizado para grandes modelos de linguagem (LLMs), marcando a entrada mais agressiva da OpenAI no mercado de hardware personalizado para inteligência artificial.
O chip, desenvolvido em parceria entre as duas empresas, foi projetado especificamente para executar inferência de modelos de IA em escala, com foco em eficiência energética e custo por token — dois dos maiores gargalos para a operação de modelos como o GPT-5 em produção.
O chip Jalapeño
Diferente das GPUs de uso geral da Nvidia que dominam o mercado atual, o Jalapeño é um ASIC (circuito integrado de aplicação específica) construído sob medida para as cargas de trabalho de inferência dos modelos da OpenAI. A Broadcom contribuiu com sua expertise em design de chips personalizados — a mesma que usa para clientes como Google (TPUs) e Meta.
O nome “Jalapeño” segue a tradição da OpenAI de batizar seus projetos com temas inusitados, e o chip representa uma mudança estratégica significativa: em vez de depender exclusivamente de fornecedores externos como a Nvidia, a OpenAI está construindo sua própria pilha de hardware.
Por que isso importa
O anúncio acontece em um momento em que a indústria de IA busca alternativas ao domínio da Nvidia no mercado de chips para IA, que controla cerca de 80% do mercado de aceleradores. Empresas como Google, Amazon e Microsoft já desenvolveram seus próprios chips (TPU, Trainium e Maia, respectivamente), e a OpenAI agora se junta a esse grupo.
A inferência — o processo de gerar respostas a partir de modelos já treinados — representa a maior parte dos custos operacionais de serviços como o ChatGPT. Um chip otimizado para essa tarefa específica pode reduzir significativamente os custos e a latência, permitindo que a OpenAI escale seus serviços de forma mais econômica.
Além disso, ter controle sobre o hardware dá à OpenAI mais flexibilidade para otimizar seus modelos para arquiteturas específicas, potencialmente resultando em ganhos de desempenho que não seriam possíveis com hardware de prateleira.
O contexto competitivo
A parceria OpenAI-Broadcom se junta a uma série de movimentos recentes no mercado de chips para IA. A Google continua expandindo sua família de TPUs, a Amazon desenvolve os chips Trainium e Inferentia para AWS, a Microsoft avança com seus aceleradores Maia, e a Meta trabalha em seu chip MTIA. A Qualcomm, por sua vez, acaba de adquirir a Modular por US$ 4 bilhões para expandir sua presença em data centers.
Disponibilidade
O Jalapeño será inicialmente implantado nos próprios data centers da OpenAI e, segundo fontes próximas ao projeto, poderá eventualmente ser oferecido a clientes enterprise através da plataforma Azure, parceira de nuvem da OpenAI. A produção em volume está prevista para começar no final de 2026.


