🪟 O que é Janela de Contexto
A janela de contexto é o limite máximo de texto que o modelo pode processar em uma única requisição. Ela inclui todo o histórico da conversa, os arquivos abertos, o CLAUDE.md e a resposta que será gerada. Quando atinge o limite, algo precisa ser descartado.
📊 O que consome contexto em uma sessão
Distribuição aproximada em uma sessão típica de trabalho
📋 Limites dos modelos Claude
Claude Sonnet 4.6
200K
tokens de contexto
Uso típico por req.
40-80K
tokens por requisição
1K tokens ≈
~750
palavras em inglês
📉 Quando o Contexto Enche
Quando o contexto se aproxima do limite, o CC começa a "esquecer" partes antigas da conversa. Isso causa comportamentos inconsistentes que parecem erros do modelo — mas na verdade é falta de contexto. Reconhecer os sinais cedo é essencial.
⚠️ Sinais de contexto degradado
- • CC contradiz decisões tomadas 10+ mensagens atrás
- • CC "recria" variáveis ou funções que já existem no projeto
- • CC pergunta coisas que você já respondeu na sessão
- • Respostas ficam mais genéricas e menos específicas ao projeto
- • CC ignora convenções definidas no início da sessão
- • Código gerado não segue o estilo do projeto
💡 Ação quando notar degradação
Quando perceber qualquer um desses sinais: execute /compact imediatamente ou inicie uma nova sessão. Continuar com contexto degradado produz resultado de má qualidade e desperdiça tokens.
🗜️ Usando /compact
O comando /compact pede ao CC para criar um sumário compacto de toda a conversa, substituindo o histórico longo por um resumo eficiente. As decisões importantes são preservadas; o texto verboso é descartado.
🗜️ Como /compact funciona
Você digita /compact
O CC analisa todo o histórico da conversa atual
CC gera um sumário
Preserva: decisões tomadas, código relevante, contexto ativo. Descarta: repetições, perguntas já respondidas, discussões resolvidas
Contexto liberado
A sessão continua com muito mais espaço disponível — como um "refresh" sem perder o progresso
✓ Use /compact quando
- ✓ A sessão está com 10+ mensagens de trabalho intenso
- ✓ Antes de começar uma tarefa complexa nova
- ✓ Proativamente, sem esperar sinais de degradação
✗ /compact não resolve
- ✗ Contexto já completamente esgotado — use /clear e nova sessão
- ✗ Arquivos muito grandes abertos no contexto
- ✗ Necessidade de memória perfeita de todas as mensagens
⚙️ autoCompactThreshold
Em vez de lembrar de usar /compact, configure o autoCompactThreshold no settings.json. Quando o contexto atingir a porcentagem configurada, o CC compacta automaticamente — sem interromper seu fluxo.
{
"autoCompactThreshold": 75,
// Compacta automaticamente aos 75% do contexto
"env": {
// Para uso com Ollama (Trilha 3)
"ANTHROPIC_BASE_URL": "http://localhost:11434",
"ANTHROPIC_AUTH_TOKEN": "ollama"
}
}
Guia de valores para autoCompactThreshold
Conservador — compacta cedo demais
Boa para sessões com muito código sendo lido. Pode compactar antes da necessidade real.
Equilibrado — recomendado para uso geral
Compacta com antecipação suficiente, mantém contexto rico por mais tempo.
Agressivo — aguarda até quase esgotado
Maximiza o uso do contexto, mas corre risco de degradação antes da compactação.
💡 Como configurar
Abra ou crie o arquivo ~/.claude/settings.json e adicione a configuração. Ou peça ao próprio CC:
> Configure autoCompactThreshold para 75 no settings.json
🧠 CLAUDE.md como Âncora de Contexto
Uma das vantagens mais poderosas do CLAUDE.md: ele é carregado no início de cada sessão e sobrevive ao /compact. Isso o torna uma âncora de contexto permanente — informações que nunca se perdem, independente de quantas compactações ocorram.
⚓ O que ancorar no CLAUDE.md
Decisões arquiteturais
"Decidimos usar PostgreSQL em vez de MongoDB após análise de performance"
Padrões que o CC deve seguir
"Toda função assíncrona deve usar async/await, nunca callbacks"
Contexto de ambiente
"Ambiente de dev usa porta 8000, staging usa porta 8080"
Restrições críticas
"NUNCA modificar migrations já executadas — sempre criar nova migration"
💡 Atualizando CLAUDE.md durante a sessão
Após uma decisão importante na sessão, peça ao CC para atualizar o CLAUDE.md imediatamente:
> Adicione ao CLAUDE.md que decidimos usar Redis para cache em vez de memória local
Na próxima sessão, essa decisão já estará no contexto automaticamente.
🔄 Quando Começar Nova Conversa
Para projetos grandes, a estratégia de dividir o trabalho em sessões por feature ou componente produz resultados muito melhores do que tentar fazer tudo em uma sessão única e longa.
🗺️ Estratégia por features
Inicie a sessão da feature
CC carrega CLAUDE.md com todo o contexto do projeto. Contexto limpo, atenção total na feature.
Trabalhe até completar ou atingir um checkpoint
Use /compact proativamente. Mantenha o foco na feature atual sem desvios.
Antes de encerrar: atualize o CLAUDE.md
"Adicione ao CLAUDE.md que o módulo de autenticação foi implementado usando JWT com refresh tokens de 7 dias"
Faça commit e inicie nova sessão para a próxima feature
Nova sessão = contexto limpo + CLAUDE.md atualizado com o progresso da sessão anterior.
📊 Consumo de tokens por sessão
Uma sessão de trabalho intenso no Claude Code consome tipicamente entre 40K–80K tokens por requisição. Isso é normal — significa que o CC está trabalhando com bastante contexto de código.
- Sessão leve (perguntas, análises): 10-30K tokens
- Sessão típica (código + edições): 40-80K tokens
- Sessão intensa (refatoração grande): 80-150K tokens
💡 Regra prática
Se uma sessão está indo bem mas mudando completamente de assunto (ex: foi frontend, agora é banco de dados), considere iniciar uma nova. Sessões focadas em um único contexto produzem resultados mais coerentes e eficientes.
✅ Resumo do Módulo 5.4
Trilha Concluída!
Você completou a Trilha 5 — Na Prática. Agora você tem as habilidades para usar Claude Code com eficiência real em projetos profissionais.