Tag: memória

  • Claude-Mem: a “memória infinita” que faz o Claude Code lembrar do que já fez

    Claude-Mem: a “memória infinita” que faz o Claude Code lembrar do que já fez

    Meta description: Conheça o Claude-Mem, a camada de memória persistente para Claude Code que registra o que o agente fez, comprime o histórico com IA e injeta apenas o contexto relevante nas próximas sessões.

    Claude-Mem: a “memória infinita” que faz o Claude Code lembrar do que já fez

    Se você já usou um assistente de programação por mais de uma sessão, provavelmente viveu este cenário: o trabalho anda, a conversa cresce, e depois o sistema parece esquecer decisões importantes. O Claude-Mem foi criado para resolver exatamente isso. Ele adiciona uma camada de memória persistente ao Claude Code — e também a outras ferramentas compatíveis — para que o agente consiga continuar projetos sem começar do zero a cada nova conversa.

    Em linguagem simples: o Claude-Mem guarda o que foi aprendido, organiza esse histórico de forma inteligente e devolve só o que importa quando o trabalho continua. O resultado é um uso muito mais eficiente do contexto e, consequentemente, menos desperdício de tokens. A documentação do projeto destaca uma abordagem em camadas que pode trazer cerca de 10x de economia em relação a métodos tradicionais. Em situações práticas, isso ajuda bastante a reduzir custo, ruído e retrabalho — e pode chegar muito perto daquela sensação de “quase não gastei contexto nenhum”.

    O problema que ele resolve

    Modelos de IA são ótimos para raciocinar, mas têm um problema estrutural: o contexto é limitado e caro. Se você coloca tudo dentro da janela de conversa, gasta tokens demais. Se coloca pouco, o agente esquece. O Claude-Mem tenta resolver justamente essa tensão com uma ideia simples:

    • registrar tudo o que importa ao longo da sessão;
    • compactar esse material para não desperdiçar tokens;
    • recuperar só o que faz sentido na hora de continuar o trabalho.

    Isso é especialmente útil em tarefas longas, como manutenção de código, debugging em múltiplas etapas, revisões de arquitetura, investigação de bugs históricos e projetos que avançam em várias sessões ao longo de dias ou semanas.

    Como o Claude-Mem funciona por dentro

    De acordo com a documentação oficial, a arquitetura do projeto combina alguns blocos centrais:

    • Hooks de ciclo de vida que observam o que acontece durante a sessão;
    • Worker service local, com API HTTP e interface web em http://localhost:37777;
    • Banco SQLite para armazenar sessões, observações e resumos;
    • Busca híbrida, unindo indexação textual e vetorial;
    • MCP search tools para consultar a memória de forma progressiva e econômica.

    O ponto mais interessante é o fluxo de consulta em três níveis:

    1. Search — traz um índice compacto com IDs e pistas rápidas;
    2. Timeline — mostra o contexto cronológico ao redor de um ponto relevante;
    3. Get observations — abre o detalhe completo apenas do que realmente importa.

    Esse desenho evita o erro clássico de “carregar tudo por via das dúvidas”. Em vez disso, o sistema começa pequeno, filtra bem e só aprofunda quando necessário.

    Quais são as funcionalidades mais fortes

    1. Memória persistente entre sessões

    O grande valor do Claude-Mem é manter o histórico útil vivo mesmo depois que a sessão termina. Isso reduz repetição, evita que o agente peça de novo as mesmas informações e ajuda a manter coerência em projetos longos.

    2. Progressive disclosure

    Em vez de despejar todo o histórico no prompt, o Claude-Mem revela o contexto em camadas. Isso melhora a eficiência e mantém o uso de tokens sob controle.

    3. Busca semântica e cronológica

    O projeto não depende só de palavras-chave. Ele também permite navegar por contexto temporal e por observações detalhadas, o que facilita encontrar decisões antigas, mudanças de rota e causas de bugs.

    4. Interface web local

    O worker service expõe uma UI web local, o que ajuda a inspecionar a memória, acompanhar o que foi armazenado e entender como o contexto está sendo recuperado.

    5. Privacidade e controle

    O Claude-Mem inclui recursos para controlar o que entra na memória, inclusive com tags <private> para excluir conteúdos sensíveis do armazenamento.

    6. Compatibilidade ampla

    Embora a vitrine principal seja o Claude Code, o projeto também conversa com outras ferramentas e ecossistemas, como Gemini CLI, OpenCode, Cursor e integrações via MCP.

    Por que ele economiza tantos tokens?

    A resposta está no método. Em vez de resgatar o passado inteiro a cada nova consulta, o Claude-Mem usa um funil de recuperação:

    • primeiro encontra o que parece relevante;
    • depois mostra o contexto ao redor;
    • só então abre os detalhes.

    Na documentação, o projeto descreve esse modelo como uma forma de alcançar ~10x de economia de tokens em comparação com abordagens tradicionais de RAG que tentam carregar muito conteúdo logo de início. Em uso real, isso pode ser ainda mais valioso quando o agente lida com sessões grandes, porque o ganho não é apenas financeiro: o modelo também tende a ficar mais rápido, mais focado e menos confuso.

    Em resumo: menos contexto irrelevante significa menos custo, menos ruído e mais chance de o agente acertar a próxima ação.

    Como instalar o Claude-Mem

    A forma mais direta de instalar é via npx:

    npx claude-mem install

    Se você usa o Gemini CLI, o instalador também detecta a pasta correta automaticamente:

    npx claude-mem install --ide gemini-cli

    Para o OpenCode:

    npx claude-mem install --ide opencode

    Há também instalação pela marketplace de plugins dentro do Claude Code:

    /plugin marketplace add thedotmack/claude-mem
    /plugin install claude-mem

    Depois da instalação, é preciso reiniciar o Claude Code ou a CLI compatível para que a memória comece a aparecer automaticamente nas novas sessões.

    Requisitos e dependências

    • Node.js 20+
    • Claude Code com suporte a plugins
    • Bun para o worker service
    • uv para partes da busca vetorial
    • SQLite 3 para persistência local

    Ou seja: não é só um “prompt hack”. É uma camada de memória de verdade, com persistência local e serviços auxiliares para consulta e recuperação de contexto.

    Como usar no dia a dia

    Na prática, o uso é quase invisível. O sistema observa a sessão, registra o que aconteceu e vai alimentando a memória. Quando você retoma um trabalho depois, ele tenta recuperar o que interessa sem você precisar refazer todo o briefing.

    Para buscas mais específicas, a documentação mostra exemplos como:

    search(query="authentication bug", type="bugfix", limit=10)
    
    timeline(anchor=<observation_id>, depth_before=3, depth_after=3)
    
    get_observations(ids=[123, 456, 789])

    Esse trio é o coração da experiência. Primeiro você encontra, depois contextualiza, por fim aprofunda.

    Casos de uso em que ele brilha

    • Debugging longo — quando um erro leva várias etapas para ser resolvido;
    • Refatorações grandes — quando decisões antigas precisam ser lembradas com precisão;
    • Code archaeology — para entender por que algo foi feito de determinada forma;
    • Projetos multi-sessão — quando o trabalho se estende por dias ou semanas;
    • Times e agentes múltiplos — quando vários fluxos precisam acessar o mesmo histórico de forma eficiente.

    Limitações e cuidados

    Apesar do nome chamativo, o Claude-Mem não é magia. Ele ajuda muito, mas ainda depende de alguns cuidados:

    • nem tudo deve ir para a memória — conteúdo sensível precisa ser excluído ou marcado como privado;
    • o ganho real depende do fluxo — quanto mais você evita carregar contexto inútil, maior o benefício;
    • instalação e integração exigem ambiente compatível — Node, Bun, SQLite e a CLI certa;
    • memória não substitui disciplina — uma boa organização de projeto ainda faz diferença.

    Vale a pena?

    Se você usa Claude Code com frequência e trabalha em tarefas que ultrapassam uma sessão, a resposta curta é: sim, vale muito a pena testar. O Claude-Mem ataca um problema real de produtividade para quem vive de contexto técnico. Ele reduz repetição, melhora continuidade, ajuda a recuperar decisões antigas e pode cortar de forma expressiva o gasto com tokens.

    O melhor cenário é justamente aquele em que você alterna entre explorar, resolver, revisar e continuar. Nessa rotina, ter uma memória persistente muda o jogo.

    Conclusão

    O Claude-Mem mostra que a próxima fronteira dos agentes de IA não é apenas “responder melhor”, mas lembrar melhor. Em vez de depender de prompts cada vez maiores, ele organiza o conhecimento em camadas, recupera o que importa e mantém a continuidade entre sessões. Para quem usa Claude Code como copiloto de desenvolvimento, isso pode representar um salto enorme em eficiência — inclusive na economia de tokens.

    Se a promessa de até 95% de redução soa exagerada à primeira vista, o ponto principal continua sendo válido: quanto mais inteligente for a recuperação do contexto, menos você paga para repetir o que já foi aprendido.

    Fonte: github.com/thedotmack/claude-mem

  • Perplexity Lança Brain: Sistema de Memória Auto-Evolutiva que Constrói Grafo de Contexto do Trabalho do Agente

    Perplexity Lança Brain: Sistema de Memória Auto-Evolutiva que Constrói Grafo de Contexto do Trabalho do Agente

    A Perplexity acaba de lançar o Brain, um sistema de memória auto-evolutiva para o seu agente de IA, o Computer. Mas, diferente de tudo que já vimos em memória de IA, o Brain não foi feito para lembrar de você — ele foi feito para lembrar do trabalho do agente.

    O que é o Perplexity Brain?

    O Brain é um sistema de memória que constrói um grafo de contexto de todo o trabalho que o Computer realiza. Em intervalos definidos (como durante a noite), o Brain revisa esse grafo e ensina a si mesmo como fazer o trabalho melhor.

    A lógica é simples: quanto mais você usa, mais eficiente o Computer fica.

    O Brain está sendo lançado hoje para assinantes do Perplexity Max e Enterprise Max, em fase de Research Preview.

    Dois eixos da memória em IA

    A Perplexity divide a memória de IA em dois eixos: sobre o que é a memória e para que ela serve.

    Tradicionalmente, a memória de IA é sobre o usuário — preferências, gostos, estilo de trabalho, contatos. Sua finalidade é engajamento: fazer você se sentir mais conectado ao agente.

    O Brain escolheu o caminho oposto:

    Dimensão Memória tradicional (usuário) Brain (memória de trabalho)
    Sobre o que é O usuário O trabalho do agente
    O que lembra Preferências, gostos, estilo, contatos O que o agente fez, o que funcionou, o que falhou, correções
    Para que serve Sentir-se mais engajado com o agente Ajudar o agente a fazer melhor o trabalho
    O que produz Um perfil do usuário Um grafo de contexto rastreável do trabalho

    Como o Grafo de Contexto funciona

    O Brain cria um grafo de contexto vivo para o Computer. Esse grafo é rastreável — cada entrada de memória tem um link de volta para a sessão, arquivo ou fonte que a originou.

    A camada de contexto assume a forma de uma wiki baseada em LLM, automaticamente carregada no sandbox do agente. Suas páginas refletem ideias, pessoas, projetos e outros elementos do mundo do usuário.

    Durante a noite, o Brain sintetiza incrementalmente as sessões do usuário, resultados de conectores, mudanças em documentos-fonte e correções feitas. Esse contexto atualizado dá ao Computer um sinal mais forte sobre o que fazer e onde procurar.

    Auto-melhoria recursiva

    O Brain melhora conforme você usa o Computer. Os agentes aprendem os projetos, conectores, artefatos e preferências de como o trabalho é feito. Nas palavras da Perplexity, o conjunto de dados de treinamento cresce com o uso:

    “Quanto mais você usa o Computer, mais o Brain aprende com seu trabalho.”

    Isso cria um ciclo de auto-melhoria recursiva: o agente fica melhor no trabalho → você usa mais → o agente fica ainda melhor.

    Implicações

    O Brain da Perplexity representa uma mudança de paradigma na memória de IA. Enquanto a maioria das empresas foca em fazer o agente te conhecer melhor, a Perplexity foca em fazer o agente trabalhar melhor.

    Se essa abordagem ganhar tração, podemos ver outros assistentes de IA seguindo o mesmo caminho — priorizando a competência do agente sobre a personalização do usuário.

    O lançamento do Brain reforça a estratégia da Perplexity de competir com gigantes como OpenAI e Google não apenas na qualidade do modelo, mas na experiência completa do agente — algo que vai muito além de respostas para perguntas.

  • MIT Desenvolve Memória Espacial para Robôs: DAAAM Responde ‘Onde Deixei Minhas Chaves?’

    MIT Desenvolve Memória Espacial para Robôs: DAAAM Responde ‘Onde Deixei Minhas Chaves?’

    Pesquisadores do MIT desenvolveram uma estrutura de memória de longo prazo que permite que robôs formem e recuperem rapidamente um modelo mental detalhado de ambientes complexos e de grande escala.

    Chamado de DAAAM (Describe Anything Anywhere At Any Moment), o novo método combina representações avançadas de mapas com descrições ricas do ambiente que o robô coleta enquanto se move por longos períodos. O robô pode acessar rapidamente essa memória para responder a consultas complexas sobre seu ambiente em linguagem natural.

    “Se queremos que robôs trabalhem lado a lado com humanos e interajam melhor com eles, eles precisam falar a mesma língua. O robô deve ser capaz de raciocinar sobre tempo e espaço da mesma forma que os humanos fazem. É essencialmente isso que nosso método está fazendo. Ele está transformando um mapa tradicional em um mapa baseado em linguagem, mais fácil para o robô pensar e acessar usando linguagem”, explica Luca Carlone, professor associado do Departamento de Aeronáutica e Astronáutica do MIT e diretor do MIT SPARK Laboratory.

    Memória espacial eficiente

    O framework DAAAM responde a perguntas com mais precisão do que métodos de última geração e é rápido o suficiente para ser usado por um robô móvel em tempo real. Diferentemente de abordagens anteriores que exigem que o robô armazene enormes quantidades de dados brutos de sensores, o DAAAM cria descrições textuais compactas, mas detalhadas, dos objetos encontrados.

    O artigo é liderado por Nicolas Gorlo, estudante de pós-graduação do MIT, com contribuições de Lukas Schmid, ex-cientista pesquisador do SPARK Lab.

    Aplicações além da robótica

    Além de seus usos potenciais na robótica, este método pode ter aplicações em sistemas de realidade aumentada que auxiliam trabalhadores de manutenção na detecção de anomalias ou ajudam passageiros na navegação.

    Imagine um trabalhador de fábrica que se lembra da caixa onde deixou um componente parcialmente montado na noite anterior e retorna rapidamente àquele local para buscá-lo. Robôs que trabalham lado a lado com humanos teriam dificuldade em desenvolver e acessar esse mesmo tipo de memória “espaçotemporal”. Com o DAAAM, o trabalhador poderia simplesmente pedir a um assistente robótico: “Vá buscar o componente que começamos a montar ontem à noite”.

    Como o DAAAM funciona

    O sistema combina cenas 3D em grafos com embeddings de linguagem que descrevem objetos, suas localizações e relações espaciais. Quando o robô explora um ambiente — como um campus universitário — ele anexa descrições detalhadas a cada objeto que vê: bicicletas, esculturas, bancos, portas. Mais tarde, ao receber uma consulta como “onde está a escultura vermelha?”, o robô pesquisa sua memória semanticamente, não apenas por coordenadas.

    Esta abordagem é particularmente eficiente porque não requer que o robô armazene e processe todos os dados brutos de câmeras e sensores — apenas as descrições textuais e suas localizações espaciais.

    A pesquisa representa um avanço significativo na capacidade de robôs compreenderem e interagirem com ambientes complexos usando linguagem natural, aproximando-os da forma como humanos navegam e recordam espaços.

  • ChatGPT lança sistema de memória para conversas mais personalizadas e contextuais

    ChatGPT lança sistema de memória para conversas mais personalizadas e contextuais

    Nova funcionalidade de memória aprimora experiência no ChatGPT

    A OpenAI anunciou uma importante atualização para o ChatGPT: um sistema de memória que permite ao modelo lembrar preferências e informações relevantes ao longo das conversas. Com essa novidade, o chatbot consegue manter o contexto mais fresco e personalizado, oferecendo respostas mais úteis e alinhadas às necessidades dos usuários.

    Como funciona o novo sistema de memória do ChatGPT

    O sistema de memória foi desenvolvido para armazenar detalhes compartilhados pelo usuário em interações anteriores, como gostos, interesses, e informações pessoais, respeitando a privacidade e o controle do usuário. Isso evita a necessidade de repetir dados em cada conversa e torna o diálogo mais fluido e natural.

    Além disso, o ChatGPT utiliza essa memória para adaptar suas respostas, entregando conteúdos que fazem sentido com o histórico acumulado, o que é especialmente útil em interações contínuas ou para quem utiliza o chatbot para acompanhamento de projetos, estudos ou preferências pessoais.

    Disponibilidade e acesso

    O recurso de memória está sendo disponibilizado gradualmente para os usuários do ChatGPT, inicialmente para assinantes do plano ChatGPT Plus, com planos de expansão para todos os usuários no futuro próximo. A atualização é automática e não requer configurações adicionais para começar a usar.

    Usuários podem gerenciar suas memórias, podendo revisar, editar ou apagar informações armazenadas a qualquer momento, garantindo total controle sobre os dados compartilhados.

    Impacto prático para os usuários

    Com a memória ativada, o ChatGPT se torna mais eficiente para tarefas que demandam continuidade e personalização, como:

    • Assistência em estudos, lembrando tópicos e dúvidas anteriores;
    • Suporte em projetos profissionais, mantendo o contexto das demandas;
    • Recomendações personalizadas baseadas em preferências previamente informadas;
    • Conversas mais naturais, com menos necessidade de reintroduzir informações.

    Essa evolução aproxima o ChatGPT de uma experiência mais humana e prática, facilitando o uso diário da inteligência artificial.

    Links úteis

  • Como Personalizar o ChatGPT para Respostas Mais Relevantes e Consistentes

    Personalização do ChatGPT: o que é e por que importa?

    O ChatGPT, ferramenta de inteligência artificial desenvolvida pela OpenAI, oferece uma funcionalidade de personalização que permite aos usuários moldar as respostas do modelo de acordo com suas necessidades específicas. Essa personalização é feita por meio de instruções personalizadas e memória, recursos que aumentam a relevância, consistência e adequação das interações.

    Instruções personalizadas: definindo o contexto do diálogo

    As custom instructions possibilitam que o usuário informe ao ChatGPT detalhes importantes sobre suas preferências, interesses ou objetivos. Por exemplo, é possível indicar o tom desejado (mais formal ou descontraído), áreas de interesse prioritárias ou até mesmo informações pessoais que o modelo deve considerar para oferecer respostas mais alinhadas.

    Com essa abordagem, o ChatGPT entende melhor o contexto de cada conversa, tornando suas respostas mais específicas e úteis para o usuário.

    Memória: guardando informações para diálogos mais coerentes

    Além das instruções personalizadas, a memória do ChatGPT permite que o sistema lembre-se de informações compartilhadas em interações anteriores. Isso evita a necessidade de repetir dados em cada conversa e ajuda a manter a coerência ao longo do tempo.

    Por exemplo, se você informar seu nome, preferências de estilo ou temas que costuma abordar, o ChatGPT poderá utilizar esses dados para enriquecer futuras respostas, tornando a experiência mais fluida e natural.

    Benefícios práticos da personalização

    • Respostas mais relevantes: o modelo adapta suas respostas ao perfil e interesses do usuário.
    • Maior consistência: a memória evita contradições e repetições desnecessárias.
    • Economia de tempo: menos necessidade de contextualizar ou explicar detalhes em cada interação.
    • Experiência personalizada: o diálogo se torna mais próximo do estilo e tom desejados.

    Como começar a personalizar seu ChatGPT

    Para utilizar a personalização, acesse as configurações do ChatGPT e localize a seção de instruções personalizadas. Lá, você poderá preencher campos que indicam como deseja que o modelo responda e quais informações ele deve lembrar.

    É importante revisar e atualizar essas configurações conforme suas necessidades mudam, garantindo que o ChatGPT esteja sempre alinhado ao seu contexto.

    Considerações sobre privacidade e uso

    A OpenAI reforça que as informações fornecidas para personalização são tratadas com atenção à privacidade e segurança. No entanto, recomenda-se que usuários evitem compartilhar dados sensíveis ou confidenciais.

    Links úteis

  • Como a Valkey Reconstruiu sua Hashtable para Tirar o Máximo do Hardware Moderno

    Evolução das Estruturas de Dados em Sistemas de Cache

    Madelyn Olson, engenheira principal da AWS e mantenedora do projeto Valkey, apresentou na QCon San Francisco 2025 uma análise profunda sobre a reconstrução da hashtable usada pela Valkey, uma alternativa ao Redis. O foco principal foi adaptar estruturas de dados clássicas para a realidade do hardware atual, priorizando eficiência de memória e desempenho sem sacrificar a estabilidade e compatibilidade.

    Contexto: Do Redis ao Valkey

    Valkey surgiu em 2024 após mudanças na licença do Redis, levando ex-contribuidores a criar uma versão que mantém compatibilidade com comandos e funcionalidades do Redis, mas com liberdade para inovações técnicas. O objetivo era modernizar a base, especialmente a estrutura central que gerencia o armazenamento de dados — a hashtable.

    Desafios das Hashtables Tradicionais

    As hashtables clássicas, como as usadas em Redis, são baseadas em técnicas conhecidas desde os anos 2000, com muitos ponteiros e acessos dispersos na memória. Essa estrutura gera um alto overhead de ponteiros (endereços), que prejudica a densidade de armazenamento e a eficiência do cache da CPU, impactando o desempenho.

    Olson destacou que, apesar dessas limitações, a prioridade era não regredir em estabilidade e compatibilidade, pois caches são componentes críticos que não podem falhar ou apresentar comportamentos inesperados.

    Características do Valkey e o Cenário de Uso

    • Tamanho médio das chaves: cerca de 16 bytes, baseado em dados reais do AWS ElastiCache.
    • Tamanho médio dos valores: mediana de 80 bytes, com variações amplas.
    • Suporte a TTL (time to live): variado, incluindo itens voláteis e não voláteis, com diferentes durações.
    • Compatibilidade: suporte a comandos complexos e tipos de dados variados, como conjuntos e sorted sets.

    A Nova Abordagem: “Swedish” Tables

    Para aumentar a densidade de memória e reduzir o número de ponteiros, a equipe adotou o conceito das chamadas “Swedish” tables, que são hashtables cache-aware, projetadas para minimizar cache misses e maximizar o uso eficiente da memória. Essa estrutura evita o tradicional pointer-chasing ao manter os dados mais compactos e sequenciais, facilitando a prefetching de memória pelo processador.

    Insights sobre Intuição de Sistemas e Prefetching

    Olson enfatizou a importância de uma boa intuição sobre o funcionamento do hardware e do sistema operacional para otimizar estruturas de dados. O entendimento detalhado de como a CPU lida com cache, prefetching e alinhamento de memória foi fundamental para garantir ganhos reais de desempenho.

    Testes Rigorosos para Sistemas Críticos

    Como o Valkey é usado em aplicações onde o cache não pode falhar, a equipe investiu em testes extensivos para assegurar que a nova implementação não introduzisse regressões ou inconsistências. Isso inclui testes de compatibilidade com comandos avançados e cenários de uso variados, garantindo que a migração para a nova hashtable seja transparente para os usuários.

    Impactos Práticos e Próximos Passos

    Com essa modernização, o Valkey consegue oferecer melhor uso da memória e maior velocidade, sem perder a robustez necessária para ambientes de produção. A iniciativa demonstra como é possível atualizar estruturas de dados clássicas para aproveitar o hardware moderno, beneficiando sistemas de cache e bancos de dados em geral.

    Links úteis