Por que migrar do Amazon Nova 1 para o Amazon Nova 2?

\n

Se você utiliza modelos Amazon Nova 1 no Amazon Bedrock, a migração para o Amazon Nova 2 pode trazer ganhos significativos. O Nova 2 amplia a janela de contexto de 300 mil para 1 milhão de tokens, melhora o raciocínio, e integra ferramentas nativas como web grounding e um interpretador de código Python. Isso permite processar documentos maiores, executar workflows complexos e obter respostas mais precisas com menor latência.

\n\n

Modelos e caminhos recomendados para migração

\n

\n\n

Principais casos de uso do Amazon Nova 2 Lite

\n

\n\n

Novidades técnicas do Amazon Nova 2

\n

\n\n

Alterações na API e atualizações de código

\n

Para migrar, atualize o modelId para a versão Nova 2 Lite disponível nos endpoints Global CRIS, US CRIS, EU CRIS e JP CRIS. Exemplo de uso da API Converse com Boto3:

\n

import boto3\nbedrock = boto3.client('bedrock-runtime', region_name='us-east-1')\nresponse = bedrock.converse(\n    modelId='us.amazon.nova-2-lite-v1:0',\n    system=[{'text': 'You are a helpful assistant'}],\n    messages=[{'role': 'user', 'content': [{'text': 'Explique computação em nuvem de forma simples.'}]}],\n    inferenceConfig={\n        'maxTokens': 1024,\n        'temperature': 0.7,\n        'topP': 0.9\n    }\n)\nprint(response['output']['message']['content'][0]['text'])\n

\n

Note que para usar o recurso de extended thinking é necessário incluir o parâmetro reasoningConfig dentro de additionalModelRequestFields, com níveis low, medium ou high. Exemplo com esforço médio:

\n

response = bedrock.converse(\n    modelId='us.amazon.nova-2-lite-v1:0',\n    system=[{'text': 'You are a helpful assistant'}],\n    messages=[{'role': 'user', 'content': [{'text': 'Um bastão e uma bola custam $1,10 no total. O bastão custa $1,00 a mais que a bola. Quanto custa a bola?'}]}],\n    inferenceConfig={\n        'maxTokens': 10000,\n        'temperature': 0.7,\n        'topP': 0.9\n    },\n    additionalModelRequestFields={\n        'reasoningConfig': {\n            'type': 'enabled',\n            'maxReasoningEffort': 'medium'\n        }\n    }\n)\n

\n

Para o nível de esforço high, não inclua os parâmetros maxTokens, temperature, topP nem topK, sob pena de erro na requisição.

\n\n

Checklist para migração

\n

    \n

  1. Atualize o modelId para us.amazon.nova-2-lite-v1:0 ou equivalente regional.
  2. \n

  3. Revise o uso de parâmetros de inferência, especialmente se utilizar maxReasoningEffort em nível high.
  4. \n

  5. Teste os níveis de esforço do reasoning para identificar o melhor equilíbrio entre custo e qualidade para seu caso.
  6. \n

  7. Explore as ferramentas nativas como web grounding e interpretador de código para enriquecer suas aplicações.
  8. \n

  9. Monitore o desempenho e custos usando as métricas do Amazon Bedrock e ajuste configurações conforme necessário.
  10. \n

\n\n

Links úteis para aprofundamento

\n

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *