MÓDULO 2.4

🧠 Contexto & Tokens

A qualidade de um agente não é fixa: ela apodrece quanto mais longa fica a sessão. Quanto mais a conversa enche, mais a janela vira ruído e mais o agente "derrapa". Este módulo te dá a disciplina de gerenciar o contexto e os tokens — saber ler os limiares, quando dar /compact, quando dar /clear, e como manter cada sessão enxuta para a qualidade ficar alta do começo ao fim.

6
Tópicos
~40
Minutos
Inter.
Nível
Disciplina
Tipo
Progresso do módulo 0% · 0 de 6

Pense na janela de contexto como o tanque de combustível da sessão. Cada mensagem sua, cada resposta do agente, cada arquivo lido e cada ferramenta carregada ocupa tokens — pedaços de texto que o modelo tem que "segurar na cabeça" ao mesmo tempo. O tanque tem capacidade fixa. À medida que enche, a qualidade não cai de repente: ela vai degradando. Por volta de ~60% de uso os erros começam a aparecer. A boa notícia: você tem dois pedais — /compact e /clear — para recuperar fôlego antes do tanque transbordar.

Tanque de contexto — enche conforme a sessão cresce → ~80% ~60% · qualidade começa a cair qualidade alta qualidade caindo ~70% → /compact 85%+ → /clear

Diagrama ilustrativo — o tanque enche com a história da conversa; passe a "ler o medidor" e use /compact por volta de 70% e /clear acima de 85% para a qualidade não despencar.

1

🍂 Context rot — degradação após ~60%

O que é

Context rot ("apodrecimento de contexto") é a degradação gradual da qualidade das respostas quanto mais longa fica uma única sessão. Não é um bug nem um modelo "cansado": é uma consequência de como a atenção do modelo funciona. Quanto mais texto está na janela, mais coisa a IA tem que ponderar de uma vez — e, passado um certo ponto (na prática, por volta de ~60% de uso), os erros começam a aparecer.

O que é?Janela de contexto — tudo o que o modelo "enxerga" agora: suas mensagens, as respostas, arquivos lidos e instruções. Token — o pedacinho de texto que o modelo conta (uma palavra costuma valer 1 a 3 tokens). A janela tem um limite de tokens.

O mecanismo é simples de visualizar: conforme a conversa cresce, a janela enche de histórico ruidoso — tentativas que não deram certo, arquivos que você nem usa mais, idas e voltas. As mensagens recentes (que muitas vezes não são as mais importantes) começam a "abafar" as regras centrais do começo. O agente passa a esquecer instruções, repetir o que já fez ou misturar coisas — sintomas clássicos de contexto inchado.

Por que aprender

Quem não conhece o context rot culpa o modelo ("a IA ficou burra"), quando o problema é a sessão ter ficado longa demais. Reconhecer o padrão muda tudo: em vez de brigar com o agente, você limpa o tanque e a qualidade volta.

  • Diagnóstico certo: "está ruim" vira "o contexto está cheio", que tem solução.
  • Qualidade estável: você intervém antes dos ~60%, não depois do estrago.
  • Menos retrabalho: sessões curtas e limpas erram menos e gastam menos token.

Conceitos-chave

Degrada gradual

Não cai de repente.

~60% é o limiar

Erros começam aí.

Ruído abafa regra

Histórico esconde o essencial.

Atenção limitada

Raiz do fenômeno.

2

🚥 Os limiares (0-50 / 50-70 / 70-85 / 85%+)

O que é

Em vez de tratar o uso da janela como "cheio ou vazio", divida-o em quatro faixas com ações diferentes. Pense num semáforo: 0-50% é zona segura — trabalhe à vontade; 50-70% é o amarelo — comece a pensar em compactar; 70-85% é laranja — rode /compact proativamente; 85%+ é a zona crítica — dê /clear e recomece do zero.

% de uso da janela de contexto → 0–50% · seguro trabalhe à vontade 50–70% pensar em /compact 70–85% /compact agora 85%+ /clear · recomece 0% 50% 70% 85% 100%

Diagrama ilustrativo — os números são guias práticos, não regras exatas. O hábito que importa é: olhe o medidor e aja antes de chegar à faixa crítica.

Por que aprender

Limiares transformam uma sensação vaga ("acho que está ficando confuso") em uma rotina objetiva. Você para de reagir ao desastre e passa a agir preventivamente: ao bater os 70%, compactar já é reflexo; ao passar de 85%, zerar é automático. É a diferença entre dirigir olhando o painel e dirigir até o carro morrer na estrada.

🎯 Dica prática

Trate o limiar de 70% como um "checkpoint": é o momento natural de pausar, rodar /compact e reavaliar se ainda faz sentido continuar na mesma tarefa. Não espere o agente começar a errar para olhar o medidor — ele já vai estar atrasado.

Conceitos-chave

0–50% seguro

Trabalhe sem preocupação.

50–70% atenção

Pense em compactar.

70–85% /compact

Compacte proativamente.

85%+ /clear

Zere e recomece.

3

🧹 /clear vs /compact

O que é

São os dois comandos para gerenciar o tanque. /clear é o reset total: apaga toda a conversa e começa do zero, com o contexto vazio — use quando for trocar de tarefa ou quando a qualidade já degradou de vez. /compact é o resumo inteligente: o agente condensa a conversa, guarda o que importa (decisões, estado atual, regras) e comprime o resto — use no meio de uma tarefa longa, quando o contexto está alto mas você ainda precisa do histórico.

O que é?/clear = esvaziar a caixa (perde o histórico, ganha contexto limpo). /compact = encolher a caixa para um resumo (mantém a essência, libera espaço). Regra de bolso: troca de assunto → /clear; mesma tarefa, tanque cheio → /compact.

/clear — reset total contexto cheio /clear vazio começa do zero /compact — resumo inteligente contexto cheio /compact resumo do essencial /clear esquece tudo · /compact lembra o que importa em menos espaço

Diagrama ilustrativo — /clear zera; /compact encolhe mantendo decisões e estado. Escolha pela intenção: trocar de tarefa, ou continuar a mesma com menos peso.

Por que aprender

Usar o comando errado custa caro: dar /clear no meio de uma tarefa longa apaga o estado que você ainda precisava (e você reconstrói tudo na mão); dar /compact achando que vai "resumir" uma troca de assunto deixa lixo da tarefa antiga contaminando a nova. Saber qual usar, e quando, é o que separa quem mantém qualidade de quem briga com o agente.

✓ /clear quando…

  • Você vai começar uma tarefa nova e não relacionada.
  • A qualidade já degradou de vez (correções repetidas, esquecimentos).
  • O tanque passou de 85% e o histórico antigo não importa mais.

✗ /compact quando NÃO deveria

  • Trocar de assunto achando que o resumo "limpa" a tarefa anterior.
  • Compactar a cada mensagem por ansiedade (você só perde detalhe útil).
  • Usar /compact para "consertar" uma sessão já podre — aí é /clear.

🎯 Objetivo: recuperar qualidade quando o contexto passa de ~70%

comando (copie e rode)
/compact

✅ Como verificar: o agente devolve um resumo do que importa; se a qualidade ainda cair ou você for trocar de tarefa, use /clear.

Conceitos-chave

/clear = zerar

Reset total da conversa.

/compact = encolher

Resumo que mantém o essencial.

Trocou tarefa?

/clear, sempre.

Mesma tarefa?

/compact no meio dela.

4

1️⃣ Uma tarefa por sessão

O que é

A regra de higiene mais simples e mais poderosa: uma tarefa por sessão. Você foca em um objetivo, termina, dá /clear e só então começa o próximo. Nada de reaproveitar uma conversa inchada de uma tarefa antiga para fazer algo sem relação — esse é o caminho mais rápido para o context rot.

O que é?Sessão — uma conversa contínua com o agente, do início até você zerar. Conversa inchada — uma sessão que acumulou tarefas, tentativas e arquivos de mais, deixando a janela cheia de ruído.

1 início (limpo) 2 trabalho na tarefa 3 ~70% → /compact 4 tarefa concluída 5 trocar tarefa → /clear Ciclo de vida de uma sessão saudável

Diagrama ilustrativo — uma tarefa nasce limpa, é compactada no meio quando pesa, e morre num /clear antes da próxima começar. Sessão curta = qualidade alta.

Por que aprender

Contexto limpo é precisão. Quando a sessão só tem o que importa para a tarefa atual, o agente acerta mais, alucina menos e gasta menos tokens — porque não está reprocessando histórico irrelevante a cada resposta. Misturar tarefas numa mesma conversa faz o oposto: dilui o foco e queima tokens à toa.

🎯 Dica prática

Antes de /clear, peça ao agente um resumo do que foi decidido e cole o essencial no CLAUDE.md ou numa nota. Assim a próxima sessão começa limpa e com o contexto certo já carregado — sem arrastar o lixo da conversa antiga.

Conceitos-chave

1 tarefa = 1 sessão

Termine, depois zere.

Não reaproveite

Conversa inchada = ruído.

Limpo = preciso

Menos erro, menos token.

Resuma antes

Salve o essencial e /clear.

5

🏁 Definir "pronto" (evita loop)

O que é

Definir "pronto" é dar ao agente um critério explícito de quando parar — uma definition of done. Sem isso, um agente diligente continua trabalhando "para garantir": busca mais, refaz, expande, e queima tokens (e contexto) num loop sem fim. Com um alvo claro como "exatamente 75 perfis", ele sabe a linha de chegada e para nela.

O que é?Definition of done — a condição objetiva que diz "acabou" (uma quantidade, um formato, um arquivo gerado). Loop — quando o agente fica repetindo passos sem convergir, geralmente por não saber quando é suficiente.

Por que aprender

Um loop não é só lento — ele enche o tanque. Cada busca extra, cada "deixa eu verificar de novo" empilha tokens na janela e acelera o context rot. Definir "pronto" mata o problema na raiz: o agente para no alvo, a sessão fica curta, e você não desperdiça tokens nem qualidade. É a forma mais barata de proteger o contexto: prevenir o trabalho desnecessário antes de ele acontecer.

🎯 Objetivo: dar um critério de parada explícito para evitar loop e gasto de tokens

prompt (copie e adapte)
pesquise exatamente 75 perfis de <cargo> em <setor>;
pare ao atingir 75 e me devolva a lista.

✅ Como verificar: o agente entrega 75 itens e encerra — sem ficar "buscando mais por garantia". Se ele continuar, reforce o limite no prompt.

🎯 Dica prática

Sempre que pedir algo "aberto" (pesquisar, coletar, gerar variações), inclua um número, um formato ou uma condição de parada. "Quantos?", "até quando?", "em que formato?" — responda essas três no próprio prompt e o agente não vai entrar em loop.

Conceitos-chave

Alvo explícito

"Exatamente 75 perfis".

Condição de parada

Diz quando "acabou".

Evita loop

Sem "buscar por garantia".

Poupa tokens

Trabalho desnecessário = zero.

6

💰 Economia: skills, desligar MCP, CLAUDE.md enxuto

O que é

Antes mesmo da primeira mensagem, parte do tanque já está ocupada por coisas que carregam na largada: o CLAUDE.md, as definições de cada servidor MCP, instruções de sistema. Economia de contexto é puxar três alavancas: usar skills (que carregam sob demanda, só quando acionadas, em vez de viver no CLAUDE.md), desligar MCP que você não usa (cada servidor injeta definições de ferramentas no contexto), e manter o CLAUDE.md enxuto (menos de ~500 linhas, só o que vale para toda sessão).

O que é?Skill — uma capacidade que o agente carrega só quando precisa (sob demanda), sem pesar no contexto o tempo todo. MCP — um conector que dá ferramentas ao agente; cada um adiciona definições à janela mesmo sem ser usado. CLAUDE.md — o arquivo de instruções permanentes, que carrega em toda sessão.

Alavancas de economia → menos contexto gasto na largada antes tanque pesado skills sob demanda em vez do CLAUDE.md desligar MCP não usado CLAUDE.md enxuto < ~500 linhas depois ↑ tanque leve = mais espaço para o trabalho de verdade

Diagrama ilustrativo — cada alavanca devolve espaço da janela. Junte as três (mais "uma tarefa por sessão") e você tem uma rotina de higiene de contexto.

Por que aprender

O contexto que você gasta na largada é contexto que não sobra para a tarefa. Um CLAUDE.md de 1.500 linhas e cinco MCPs ligados podem comer uma fatia grande do tanque antes de você digitar a primeira palavra — e te empurram para o limiar dos ~60% muito mais rápido. Higiene de contexto não é detalhe de avançado: é o que mantém suas sessões longas, baratas e precisas.

✓ Higiene de contexto

  • Skills carregadas sob demanda, em vez de tudo no CLAUDE.md.
  • MCP que você não usa hoje fica desligado.
  • CLAUDE.md < ~500 linhas, só o que vale para toda sessão.
  • Uma tarefa por sessão; /compact a ~70%, /clear ao trocar.

✗ Conversa inchada para tudo

  • Despejar todo o conhecimento no CLAUDE.md "por via das dúvidas".
  • Deixar dez MCPs ligados sem usar nenhum na sessão.
  • Uma única conversa gigante para todas as tarefas do dia.
  • Nunca olhar o medidor e só dar /clear quando trava.

Conceitos-chave

Skills sob demanda

Carregam só quando usadas.

Desligar MCP

Cada um pesa no contexto.

CLAUDE.md enxuto

< ~500 linhas, só o essencial.

Higiene = rotina

Junte todas as alavancas.

Fechando o módulo: seu medidor de contexto passou de 85% e você vai começar uma tarefa nova. Qual comando usar?

📌 Resumo do Módulo

Context rot — a qualidade degrada quanto mais longa a sessão; os erros começam por volta de ~60% de uso.
Limiares — 0-50% seguro · 50-70% atenção · 70-85% /compact · 85%+ /clear.
/clear vs /compact — zerar para trocar de tarefa; resumir no meio de uma tarefa longa.
Uma tarefa por sessão — termine, dê /clear, comece a próxima; limpo = preciso e barato.
Definir "pronto" — um alvo explícito ("exatamente 75 perfis") evita loop e gasto de tokens.
Economia de contexto — skills sob demanda, MCP desligado, CLAUDE.md enxuto: higiene de contexto.

Próximo Módulo:

2.5 — RAG & Dados