5.1
GA
~60 min · Intermediário · Prático
💾 Estratégias de memória: curto, longo prazo e summarização hierárquica
Como dar 'memória' a um agente: buffer de turn, summarização hierárquica, vetor de longo prazo, recall sob demanda.
1 📥 Buffer de turns: memória de curto prazo ▾
O que é: Manter os últimos N turns inteiros na janela. Simples, eficaz para conversas curtas.
Por que aprender: Em chats curtos (5-10 turns), buffer puro basta. Modelos atendem bem com janela <10k.
Conceitos-chave: Sliding window, message buffer, FIFO eviction.
2 📝 Summarização incremental ▾
O que é: Quando buffer estoura, sumariza turns antigos em parágrafo. Sumário fica no system prompt.
Por que aprender: Mantém continuidade sem inflar janela. Trade-off: perde detalhe do que foi sumarizado.
Conceitos-chave: Recursive summarization, sliding-window summarization, hierarchical.
3 🌳 Sumarização hierárquica: árvore de memória ▾
O que é: Sumariza turns em sumário-de-1; sumários-de-1 em sumário-de-2; etc. Estrutura tipo árvore.
Por que aprender: Para chats longos (centenas de turns), hierarquia preserva detalhe nos níveis superiores.
Conceitos-chave: Tree summarization, multi-level memory, MemGPT.
4 🗃️ Memória vetorial: longo prazo ▾
O que é: Cada turn vira embedding indexado. No próximo turn, busca turns relevantes ao tópico atual e injeta.
Por que aprender: Permite chats que 'lembram' de conversas de meses atrás sem manter tudo na janela.
Conceitos-chave: Long-term memory, episodic memory, recall on demand, retrieval-augmented memory.
5 🔍 Recall sob demanda: tool de memória ▾
O que é: Padrão alternativo: agente tem tool 'buscar_memoria' e decide quando precisa de info antiga.
Por que aprender: Mais explícito que injection automático. Custo: mais roundtrips, mas precisão maior.
Conceitos-chave: Active recall, memory tool, on-demand retrieval.
6 🧠 Personalização: persona + perfil do usuário ▾
O que é: Mantém ficha estruturada do usuário (nome, preferências, contexto profissional) atualizada incremental.
Por que aprender: Diferente de memória conversacional — é estado do usuário. Cabe no system prompt como JSON pequeno.
Conceitos-chave: User profile, structured memory, preference modeling.