DeepInfra passa a integrar os Inference Providers da Hugging Face: mais opções e economia para desenvolvedores de IA
A Hugging Face anunciou recentemente a integração da DeepInfra como um novo Inference Provider em sua plataforma. Essa novidade amplia o ecossistema de serviços para inferência de modelos de inteligência artificial diretamente nas páginas do Hub, trazendo vantagens práticas para desenvolvedores que buscam soluções eficientes e econômicas.
\n\n
O que é a DeepInfra e como ela funciona na Hugging Face
\n
A DeepInfra é uma plataforma de inferência de IA serverless que oferece uma das estruturas de preços mais competitivas do mercado, cobrando por token processado. Com um catálogo de mais de 100 modelos, a DeepInfra suporta diversos tipos de modelos, incluindo grandes modelos de linguagem (LLMs), geração de texto para imagem, texto para vídeo, embeddings, entre outros.
\n

\n
Na integração inicial com a Hugging Face, a DeepInfra disponibiliza suporte para tarefas de conversação e geração de texto, permitindo o acesso a modelos de código aberto populares como DeepSeek V4, Kimi-K2.6 e GLM-5.1. Em breve, a plataforma deve ampliar esse suporte para outras tarefas, como geração de imagens e vídeos, além de embeddings.
\n\n
Como usar a DeepInfra na Hugging Face
\n
O uso da DeepInfra como provedor de inferência na Hugging Face pode ser feito de forma simples, tanto via interface web quanto por meio dos SDKs para Python e JavaScript disponibilizados pela Hugging Face. Algumas funcionalidades importantes disponíveis no painel de usuário incluem:
\n
- \n
- Configurar suas próprias chaves de API dos provedores com os quais você se cadastrou.
- Definir a ordem de preferência dos provedores, o que afeta o widget e os trechos de código nas páginas dos modelos.
\n
\n
\n
Existem dois modos para chamadas aos Inference Providers:
\n
- \n
- Chave personalizada: as chamadas são feitas diretamente ao provedor de inferência usando sua própria chave de API.
- Roteado pela Hugging Face: nesse caso, não é necessária uma chave do provedor, e as cobranças são aplicadas diretamente na conta da Hugging Face.
\n
\n
\n
Nas páginas dos modelos, os provedores de terceiros compatíveis são exibidos e ordenados conforme a preferência do usuário, facilitando a escolha do serviço desejado.
\n

\n\n
Exemplos de uso via SDKs
\n
A DeepInfra pode ser acessada facilmente pelos SDKs da Hugging Face, como huggingface_hub para Python e @huggingface/inference para JavaScript. A seguir, exemplos de chamadas autenticadas que são automaticamente roteadas para a DeepInfra:
\n\n
from openai import OpenAI\nimport os\n\nclient = OpenAI(\n base_url="https://router.huggingface.co/v1",\n api_key=os.environ["HF_TOKEN"],\n)\n\ncompletion = client.chat.completions.create(\n model="deepseek-ai/DeepSeek-V4-Pro:deepinfra",\n messages=[{"role": "user", "content": "Write a Python function that returns the nth Fibonacci number using memoization."}]\n)\nprint(completion.choices[0].message)\n
\n\n
import { OpenAI } from "openai";\n\nconst client = new OpenAI({\n baseURL: "https://router.huggingface.co/v1",\n apiKey: process.env.HF_TOKEN,\n});\n\nconst chatCompletion = await client.chat.completions.create({\n model: "deepseek-ai/DeepSeek-V4-Pro:deepinfra",\n messages: [\n { role: "user", content: "Write a Python function that returns the nth Fibonacci number using memoization." },\n ],\n});\n\nconsole.log(chatCompletion.choices[0].message);\n
\n\n
Aspectos de cobrança e planos
\n
Ao utilizar uma chave de API direta do provedor, a cobrança é feita pela DeepInfra conforme seu próprio sistema. Já no modo roteado pela Hugging Face, os custos são repassados diretamente ao usuário pela Hugging Face, sem markup adicional. A plataforma também oferece um plano PRO, que inclui créditos mensais de US$ 2 para uso em diversos provedores, além de recursos como ZeroGPU, modo de desenvolvimento para Spaces, limites 20 vezes maiores e outras vantagens.
\n
Usuários gratuitos recebem uma cota pequena de uso para inferência, mas o upgrade para o plano PRO é recomendado para quem precisa de maior capacidade e recursos estendidos.
\n\n
Feedback e próximos passos
\n
A Hugging Face convida a comunidade a enviar feedback sobre a integração da DeepInfra por meio do espaço de discussões oficial: https://huggingface.co/spaces/huggingface/HuggingDiscussions/discussions/49.
\n\n
Links úteis
\n
Deixe um comentário