Pense na janela de contexto como o tanque de combustível da sessão. Cada mensagem sua, cada resposta do agente, cada arquivo lido e cada ferramenta carregada ocupa tokens — pedaços de texto que o modelo tem que "segurar na cabeça" ao mesmo tempo. O tanque tem capacidade fixa. À medida que enche, a qualidade não cai de repente: ela vai degradando. Por volta de ~60% de uso os erros começam a aparecer. A boa notícia: você tem dois pedais — /compact e /clear — para recuperar fôlego antes do tanque transbordar.
Diagrama ilustrativo — o tanque enche com a história da conversa; passe a "ler o medidor" e use /compact por volta de 70% e /clear acima de 85% para a qualidade não despencar.
🍂 Context rot — degradação após ~60%
O que é
Context rot ("apodrecimento de contexto") é a degradação gradual da qualidade das respostas quanto mais longa fica uma única sessão. Não é um bug nem um modelo "cansado": é uma consequência de como a atenção do modelo funciona. Quanto mais texto está na janela, mais coisa a IA tem que ponderar de uma vez — e, passado um certo ponto (na prática, por volta de ~60% de uso), os erros começam a aparecer.
O que é?Janela de contexto — tudo o que o modelo "enxerga" agora: suas mensagens, as respostas, arquivos lidos e instruções. Token — o pedacinho de texto que o modelo conta (uma palavra costuma valer 1 a 3 tokens). A janela tem um limite de tokens.
O mecanismo é simples de visualizar: conforme a conversa cresce, a janela enche de histórico ruidoso — tentativas que não deram certo, arquivos que você nem usa mais, idas e voltas. As mensagens recentes (que muitas vezes não são as mais importantes) começam a "abafar" as regras centrais do começo. O agente passa a esquecer instruções, repetir o que já fez ou misturar coisas — sintomas clássicos de contexto inchado.
Por que aprender
Quem não conhece o context rot culpa o modelo ("a IA ficou burra"), quando o problema é a sessão ter ficado longa demais. Reconhecer o padrão muda tudo: em vez de brigar com o agente, você limpa o tanque e a qualidade volta.
- •Diagnóstico certo: "está ruim" vira "o contexto está cheio", que tem solução.
- •Qualidade estável: você intervém antes dos ~60%, não depois do estrago.
- •Menos retrabalho: sessões curtas e limpas erram menos e gastam menos token.
Conceitos-chave
Não cai de repente.
Erros começam aí.
Histórico esconde o essencial.
Raiz do fenômeno.
🚥 Os limiares (0-50 / 50-70 / 70-85 / 85%+)
O que é
Em vez de tratar o uso da janela como "cheio ou vazio", divida-o em quatro faixas com ações diferentes. Pense num semáforo: 0-50% é zona segura — trabalhe à vontade; 50-70% é o amarelo — comece a pensar em compactar; 70-85% é laranja — rode /compact proativamente; 85%+ é a zona crítica — dê /clear e recomece do zero.
Diagrama ilustrativo — os números são guias práticos, não regras exatas. O hábito que importa é: olhe o medidor e aja antes de chegar à faixa crítica.
Por que aprender
Limiares transformam uma sensação vaga ("acho que está ficando confuso") em uma rotina objetiva. Você para de reagir ao desastre e passa a agir preventivamente: ao bater os 70%, compactar já é reflexo; ao passar de 85%, zerar é automático. É a diferença entre dirigir olhando o painel e dirigir até o carro morrer na estrada.
🎯 Dica prática
Trate o limiar de 70% como um "checkpoint": é o momento natural de pausar, rodar /compact e reavaliar se ainda faz sentido continuar na mesma tarefa. Não espere o agente começar a errar para olhar o medidor — ele já vai estar atrasado.
Conceitos-chave
Trabalhe sem preocupação.
Pense em compactar.
Compacte proativamente.
Zere e recomece.
🧹 /clear vs /compact
O que é
São os dois comandos para gerenciar o tanque. /clear é o reset total: apaga toda a conversa e começa do zero, com o contexto vazio — use quando for trocar de tarefa ou quando a qualidade já degradou de vez. /compact é o resumo inteligente: o agente condensa a conversa, guarda o que importa (decisões, estado atual, regras) e comprime o resto — use no meio de uma tarefa longa, quando o contexto está alto mas você ainda precisa do histórico.
O que é?/clear = esvaziar a caixa (perde o histórico, ganha contexto limpo). /compact = encolher a caixa para um resumo (mantém a essência, libera espaço). Regra de bolso: troca de assunto → /clear; mesma tarefa, tanque cheio → /compact.
Diagrama ilustrativo — /clear zera; /compact encolhe mantendo decisões e estado. Escolha pela intenção: trocar de tarefa, ou continuar a mesma com menos peso.
Por que aprender
Usar o comando errado custa caro: dar /clear no meio de uma tarefa longa apaga o estado que você ainda precisava (e você reconstrói tudo na mão); dar /compact achando que vai "resumir" uma troca de assunto deixa lixo da tarefa antiga contaminando a nova. Saber qual usar, e quando, é o que separa quem mantém qualidade de quem briga com o agente.
✓ /clear quando…
- ✓Você vai começar uma tarefa nova e não relacionada.
- ✓A qualidade já degradou de vez (correções repetidas, esquecimentos).
- ✓O tanque passou de 85% e o histórico antigo não importa mais.
✗ /compact quando NÃO deveria
- ✗Trocar de assunto achando que o resumo "limpa" a tarefa anterior.
- ✗Compactar a cada mensagem por ansiedade (você só perde detalhe útil).
- ✗Usar
/compactpara "consertar" uma sessão já podre — aí é/clear.
🎯 Objetivo: recuperar qualidade quando o contexto passa de ~70%
/compact
✅ Como verificar: o agente devolve um resumo do que importa; se a qualidade ainda cair ou você for trocar de tarefa, use /clear.
Conceitos-chave
Reset total da conversa.
Resumo que mantém o essencial.
/clear, sempre.
/compact no meio dela.
1️⃣ Uma tarefa por sessão
O que é
A regra de higiene mais simples e mais poderosa: uma tarefa por sessão. Você foca em um objetivo, termina, dá /clear e só então começa o próximo. Nada de reaproveitar uma conversa inchada de uma tarefa antiga para fazer algo sem relação — esse é o caminho mais rápido para o context rot.
O que é?Sessão — uma conversa contínua com o agente, do início até você zerar. Conversa inchada — uma sessão que acumulou tarefas, tentativas e arquivos de mais, deixando a janela cheia de ruído.
Diagrama ilustrativo — uma tarefa nasce limpa, é compactada no meio quando pesa, e morre num /clear antes da próxima começar. Sessão curta = qualidade alta.
Por que aprender
Contexto limpo é precisão. Quando a sessão só tem o que importa para a tarefa atual, o agente acerta mais, alucina menos e gasta menos tokens — porque não está reprocessando histórico irrelevante a cada resposta. Misturar tarefas numa mesma conversa faz o oposto: dilui o foco e queima tokens à toa.
🎯 Dica prática
Antes de /clear, peça ao agente um resumo do que foi decidido e cole o essencial no CLAUDE.md ou numa nota. Assim a próxima sessão começa limpa e com o contexto certo já carregado — sem arrastar o lixo da conversa antiga.
Conceitos-chave
Termine, depois zere.
Conversa inchada = ruído.
Menos erro, menos token.
Salve o essencial e /clear.
🏁 Definir "pronto" (evita loop)
O que é
Definir "pronto" é dar ao agente um critério explícito de quando parar — uma definition of done. Sem isso, um agente diligente continua trabalhando "para garantir": busca mais, refaz, expande, e queima tokens (e contexto) num loop sem fim. Com um alvo claro como "exatamente 75 perfis", ele sabe a linha de chegada e para nela.
O que é?Definition of done — a condição objetiva que diz "acabou" (uma quantidade, um formato, um arquivo gerado). Loop — quando o agente fica repetindo passos sem convergir, geralmente por não saber quando é suficiente.
Por que aprender
Um loop não é só lento — ele enche o tanque. Cada busca extra, cada "deixa eu verificar de novo" empilha tokens na janela e acelera o context rot. Definir "pronto" mata o problema na raiz: o agente para no alvo, a sessão fica curta, e você não desperdiça tokens nem qualidade. É a forma mais barata de proteger o contexto: prevenir o trabalho desnecessário antes de ele acontecer.
🎯 Objetivo: dar um critério de parada explícito para evitar loop e gasto de tokens
pesquise exatamente 75 perfis de <cargo> em <setor>; pare ao atingir 75 e me devolva a lista.
✅ Como verificar: o agente entrega 75 itens e encerra — sem ficar "buscando mais por garantia". Se ele continuar, reforce o limite no prompt.
🎯 Dica prática
Sempre que pedir algo "aberto" (pesquisar, coletar, gerar variações), inclua um número, um formato ou uma condição de parada. "Quantos?", "até quando?", "em que formato?" — responda essas três no próprio prompt e o agente não vai entrar em loop.
Conceitos-chave
"Exatamente 75 perfis".
Diz quando "acabou".
Sem "buscar por garantia".
Trabalho desnecessário = zero.
💰 Economia: skills, desligar MCP, CLAUDE.md enxuto
O que é
Antes mesmo da primeira mensagem, parte do tanque já está ocupada por coisas que carregam na largada: o CLAUDE.md, as definições de cada servidor MCP, instruções de sistema. Economia de contexto é puxar três alavancas: usar skills (que carregam sob demanda, só quando acionadas, em vez de viver no CLAUDE.md), desligar MCP que você não usa (cada servidor injeta definições de ferramentas no contexto), e manter o CLAUDE.md enxuto (menos de ~500 linhas, só o que vale para toda sessão).
O que é?Skill — uma capacidade que o agente carrega só quando precisa (sob demanda), sem pesar no contexto o tempo todo. MCP — um conector que dá ferramentas ao agente; cada um adiciona definições à janela mesmo sem ser usado. CLAUDE.md — o arquivo de instruções permanentes, que carrega em toda sessão.
Diagrama ilustrativo — cada alavanca devolve espaço da janela. Junte as três (mais "uma tarefa por sessão") e você tem uma rotina de higiene de contexto.
Por que aprender
O contexto que você gasta na largada é contexto que não sobra para a tarefa. Um CLAUDE.md de 1.500 linhas e cinco MCPs ligados podem comer uma fatia grande do tanque antes de você digitar a primeira palavra — e te empurram para o limiar dos ~60% muito mais rápido. Higiene de contexto não é detalhe de avançado: é o que mantém suas sessões longas, baratas e precisas.
✓ Higiene de contexto
- ✓Skills carregadas sob demanda, em vez de tudo no CLAUDE.md.
- ✓MCP que você não usa hoje fica desligado.
- ✓CLAUDE.md < ~500 linhas, só o que vale para toda sessão.
- ✓Uma tarefa por sessão;
/compacta ~70%,/clearao trocar.
✗ Conversa inchada para tudo
- ✗Despejar todo o conhecimento no CLAUDE.md "por via das dúvidas".
- ✗Deixar dez MCPs ligados sem usar nenhum na sessão.
- ✗Uma única conversa gigante para todas as tarefas do dia.
- ✗Nunca olhar o medidor e só dar
/clearquando trava.
Conceitos-chave
Carregam só quando usadas.
Cada um pesa no contexto.
< ~500 linhas, só o essencial.
Junte todas as alavancas.
Fechando o módulo: seu medidor de contexto passou de 85% e você vai começar uma tarefa nova. Qual comando usar?
📌 Resumo do Módulo
Próximo Módulo:
2.5 — RAG & Dados