DeepInfra passa a integrar os Inference Providers da Hugging Face: mais opções e economia para desenvolvedores de IA

tiago | Postado em 29 de abril de 2026 |

A Hugging Face anunciou recentemente a integração da DeepInfra como um novo Inference Provider em sua plataforma. Essa novidade amplia o ecossistema de serviços para inferência de modelos de inteligência artificial diretamente nas páginas do Hub, trazendo vantagens práticas para desenvolvedores que buscam soluções eficientes e econômicas.

\n\n

O que é a DeepInfra e como ela funciona na Hugging Face

A DeepInfra é uma plataforma de inferência de IA serverless que oferece uma das estruturas de preços mais competitivas do mercado, cobrando por token processado. Com um catálogo de mais de 100 modelos, a DeepInfra suporta diversos tipos de modelos, incluindo grandes modelos de linguagem (LLMs), geração de texto para imagem, texto para vídeo, embeddings, entre outros.

Imagem relacionada ao artigo de HuggingFace — Imagem de apoio da materia original.

Na integração inicial com a Hugging Face, a DeepInfra disponibiliza suporte para tarefas de conversação e geração de texto, permitindo o acesso a modelos de código aberto populares como DeepSeek V4, Kimi-K2.6 e GLM-5.1. Em breve, a plataforma deve ampliar esse suporte para outras tarefas, como geração de imagens e vídeos, além de embeddings.

\n\n

Como usar a DeepInfra na Hugging Face

O uso da DeepInfra como provedor de inferência na Hugging Face pode ser feito de forma simples, tanto via interface web quanto por meio dos SDKs para Python e JavaScript disponibilizados pela Hugging Face. Algumas funcionalidades importantes disponíveis no painel de usuário incluem:

Configurar suas próprias chaves de API dos provedores com os quais você se cadastrou.

Definir a ordem de preferência dos provedores, o que afeta o widget e os trechos de código nas páginas dos modelos.

Existem dois modos para chamadas aos Inference Providers:

Chave personalizada: as chamadas são feitas diretamente ao provedor de inferência usando sua própria chave de API.

Roteado pela Hugging Face: nesse caso, não é necessária uma chave do provedor, e as cobranças são aplicadas diretamente na conta da Hugging Face.

Nas páginas dos modelos, os provedores de terceiros compatíveis são exibidos e ordenados conforme a preferência do usuário, facilitando a escolha do serviço desejado.

\n\n

Exemplos de uso via SDKs

A DeepInfra pode ser acessada facilmente pelos SDKs da Hugging Face, como huggingface_hub para Python e @huggingface/inference para JavaScript. A seguir, exemplos de chamadas autenticadas que são automaticamente roteadas para a DeepInfra:

\n\n

from openai import OpenAI\nimport os\n\nclient = OpenAI(\n    base_url="https://router.huggingface.co/v1",\n    api_key=os.environ["HF_TOKEN"],\n)\n\ncompletion = client.chat.completions.create(\n    model="deepseek-ai/DeepSeek-V4-Pro:deepinfra",\n    messages=[{"role": "user", "content": "Write a Python function that returns the nth Fibonacci number using memoization."}]\n)\nprint(completion.choices[0].message)\n

\n\n

import { OpenAI } from "openai";\n\nconst client = new OpenAI({\n  baseURL: "https://router.huggingface.co/v1",\n  apiKey: process.env.HF_TOKEN,\n});\n\nconst chatCompletion = await client.chat.completions.create({\n  model: "deepseek-ai/DeepSeek-V4-Pro:deepinfra",\n  messages: [\n    { role: "user", content: "Write a Python function that returns the nth Fibonacci number using memoization." },\n  ],\n});\n\nconsole.log(chatCompletion.choices[0].message);\n

\n\n

Aspectos de cobrança e planos

Ao utilizar uma chave de API direta do provedor, a cobrança é feita pela DeepInfra conforme seu próprio sistema. Já no modo roteado pela Hugging Face, os custos são repassados diretamente ao usuário pela Hugging Face, sem markup adicional. A plataforma também oferece um plano PRO, que inclui créditos mensais de US$ 2 para uso em diversos provedores, além de recursos como ZeroGPU, modo de desenvolvimento para Spaces, limites 20 vezes maiores e outras vantagens.

Usuários gratuitos recebem uma cota pequena de uso para inferência, mas o upgrade para o plano PRO é recomendado para quem precisa de maior capacidade e recursos estendidos.

\n\n

Feedback e próximos passos

A Hugging Face convida a comunidade a enviar feedback sobre a integração da DeepInfra por meio do espaço de discussões oficial: https://huggingface.co/spaces/huggingface/HuggingDiscussions/discussions/49.

\n\n