Amazon Bedrock lança atribuição granular de custos para rastreamento detalhado de uso de IA

Com o crescimento do uso de inferência de inteligência artificial na nuvem, entender quem e o que gera custos tornou-se fundamental para otimizar gastos, realizar cobranças internas e planejar financeiramente. Pensando nisso, a AWS anunciou uma novidade para o Amazon Bedrock: a atribuição granular de custos.

\n\n

Como funciona a atribuição granular de custos no Amazon Bedrock

\n

Agora, o Amazon Bedrock atribui automaticamente os custos de inferência ao principal IAM que fez a chamada. Um principal IAM pode ser um usuário IAM, uma função assumida por um aplicativo ou uma identidade federada de provedores como Okta ou Entra ID. Essa atribuição é integrada ao sistema de faturamento da AWS, cobre todos os modelos disponíveis e não exige gerenciamento adicional de recursos ou mudanças nos fluxos existentes.

\n

Além disso, com o uso opcional de tags de alocação de custos, é possível agrupar gastos por equipe, projeto ou outras dimensões personalizadas usando o AWS Cost Explorer e o AWS Cost and Usage Reports (CUR 2.0).

\n\n

Visualizando custos detalhados no CUR 2.0

\n

Ao habilitar os dados do principal IAM na configuração de exportação do CUR 2.0, é possível identificar exatamente quem está consumindo quais recursos e quanto está gastando. Por exemplo:

\n

line_item_iam_principal                             line_item_usage_type                  line_item_unblended_cost\narn:aws:iam::123456789012:user/alice               USE1-Claude4.6Sonnet-input-tokens    $0.069\narn:aws:iam::123456789012:user/alice               USE1-Claude4.6Sonnet-output-tokens   $0.214\narn:aws:iam::123456789012:user/bob                 USE1-Claude4.6Opus-input-tokens      $0.198\narn:aws:iam::123456789012:user/bob                 USE1-Claude4.6Opus-output-tokens     $0.990\n

\n

Isso mostra que a usuária Alice consumiu tokens de entrada e saída do modelo Claude 4.6 Sonnet, enquanto Bob utilizou o Claude 4.6 Opus, com o respectivo custo detalhado.

\n\n

Agregação de custos com tags para análise por equipe ou projeto

\n

Para facilitar a análise e agrupamento de custos, é possível adicionar tags aos principais IAM. Existem duas formas principais:

\n

    \n

  • Tags permanentes: associadas diretamente a usuários ou funções IAM, aplicadas a todas as requisições daquele principal.
  • \n

  • Tags de sessão: passadas dinamicamente ao assumir uma função IAM temporária ou embutidas em assertivas de provedores de identidade federada.
  • \n

\n

Após ativar essas tags como tags de alocação de custos no console de faturamento da AWS, elas aparecem no CUR 2.0 com o prefixo iamPrincipal/, permitindo análises personalizadas.

\n\n

Exemplos práticos de cenários de atribuição de custos

\n\n

Cenário 1: Rastreamento por usuário com usuários IAM e chaves API

\n

Ideal para equipes pequenas ou ambientes de desenvolvimento onde cada desenvolvedor usa credenciais IAM ou chaves API do Amazon Bedrock. Os custos são automaticamente atribuídos ao ARN do usuário IAM. Para agrupar por time ou centro de custo, basta adicionar tags aos usuários IAM, por exemplo:

\n

# Tagueando usuários da equipe de ciência de dados\naws iam tag-user --user-name user-1 --tags Key=team,Value="BedrockDataScience" Key=cost-center,Value="12345"\naws iam tag-user --user-name user-2 --tags Key=team,Value="BedrockDataScience" Key=cost-center,Value="12345"\n

\n

No CUR 2.0, serão exibidos o usuário, o tipo de uso, o custo e as tags associadas, facilitando análises por usuário, modelo ou equipe.

\n\n

Cenário 2: Rastreamento por aplicação com funções IAM

\n

Para workloads de produção, onde aplicações assumem funções IAM para chamar o Bedrock, o custo é atribuído à função assumida. É possível adicionar tags às funções para agrupar custos por projeto ou centro de custo. Exemplo:

\n

# Tagueando funções de aplicação\naws iam tag-role --role-name Role-1 --tags Key=project,Value="DocFlow" Key=cost-center,Value="12345"\naws iam tag-role --role-name Role-2 --tags Key=project,Value="ChatBackend" Key=cost-center,Value="12345"\n

\n

Assim, o CUR 2.0 mostrará custos detalhados por função e tags, permitindo análises por aplicação, sessão ou projeto.

\n\n

Cenário 3: Rastreamento por usuário com autenticação federada

\n

Em ambientes corporativos que utilizam provedores de identidade como Okta, Azure AD ou Amazon Cognito, usuários federados assumem uma função IAM compartilhada. A atribuição por usuário ocorre via nome de sessão no ARN e tags passadas pelo provedor. O CUR 2.0 exibirá informações detalhadas por usuário mesmo que todos compartilhem a mesma função IAM.

\n\n

Cenário 4: Rastreamento por usuário em gateways de LLM

\n

Organizações que utilizam gateways ou proxies para LLM (como LiteLLM ou API gateways customizados) enfrentam o desafio de que todas as chamadas aparecem com uma única identidade no CUR. A solução é implementar gerenciamento de sessões por usuário, onde o gateway assume uma função para cada usuário com o nome da sessão e tags, permitindo atribuição individualizada e análise detalhada.

\n\n

Considerações finais e próximos passos

\n

Essa funcionalidade traz controle e transparência inéditos para o uso do Amazon Bedrock, facilitando a gestão financeira e operacional de projetos de IA. Para ativar as tags de alocação de custos, acesse o console de faturamento AWS ou utilize a API UpdateCostAllocationTagsStatus. As informações estarão disponíveis no AWS Cost Explorer e no CUR 2.0 em até 48 horas.

\n\n

Links úteis

\n

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *