Módulo 5.4 — Gerenciando o Contexto

🪟 O que é Janela de Contexto

A janela de contexto é o limite máximo de texto que o modelo pode processar em uma única requisição. Ela inclui todo o histórico da conversa, os arquivos abertos, o CLAUDE.md e a resposta que será gerada. Quando atinge o limite, algo precisa ser descartado.

📊 O que consome contexto em uma sessão

Suas mensagens

~15%

Respostas do CC

~35%

Arquivos lidos

~40%

CLAUDE.md

~5%

Outros

~5%

Distribuição aproximada em uma sessão típica de trabalho

📋 Limites dos modelos Claude

Claude Sonnet 4.6

200K

tokens de contexto

Uso típico por req.

40-80K

tokens por requisição

1K tokens ≈

~750

palavras em inglês

📉 Quando o Contexto Enche

Quando o contexto se aproxima do limite, o CC começa a "esquecer" partes antigas da conversa. Isso causa comportamentos inconsistentes que parecem erros do modelo — mas na verdade é falta de contexto. Reconhecer os sinais cedo é essencial.

⚠️ Sinais de contexto degradado

• CC contradiz decisões tomadas 10+ mensagens atrás
• CC "recria" variáveis ou funções que já existem no projeto
• CC pergunta coisas que você já respondeu na sessão

• Respostas ficam mais genéricas e menos específicas ao projeto
• CC ignora convenções definidas no início da sessão
• Código gerado não segue o estilo do projeto

💡 Ação quando notar degradação

Quando perceber qualquer um desses sinais: execute /compact imediatamente ou inicie uma nova sessão. Continuar com contexto degradado produz resultado de má qualidade e desperdiça tokens.

🗜️ Usando /compact

O comando /compact pede ao CC para criar um sumário compacto de toda a conversa, substituindo o histórico longo por um resumo eficiente. As decisões importantes são preservadas; o texto verboso é descartado.

🗜️ Como /compact funciona

Você digita /compact

O CC analisa todo o histórico da conversa atual

CC gera um sumário

Preserva: decisões tomadas, código relevante, contexto ativo. Descarta: repetições, perguntas já respondidas, discussões resolvidas

Contexto liberado

A sessão continua com muito mais espaço disponível — como um "refresh" sem perder o progresso

✓ Use /compact quando

✓ A sessão está com 10+ mensagens de trabalho intenso
✓ Antes de começar uma tarefa complexa nova
✓ Proativamente, sem esperar sinais de degradação

✗ /compact não resolve

✗ Contexto já completamente esgotado — use /clear e nova sessão
✗ Arquivos muito grandes abertos no contexto
✗ Necessidade de memória perfeita de todas as mensagens

⚙️ autoCompactThreshold

Em vez de lembrar de usar /compact, configure o autoCompactThreshold no settings.json. Quando o contexto atingir a porcentagem configurada, o CC compacta automaticamente — sem interromper seu fluxo.

~/.claude/settings.json Configuração recomendada

{
  "autoCompactThreshold": 75,
  // Compacta automaticamente aos 75% do contexto

  "env": {
    // Para uso com Ollama (Trilha 3)
    "ANTHROPIC_BASE_URL": "http://localhost:11434",
    "ANTHROPIC_AUTH_TOKEN": "ollama"
  }
}

Guia de valores para autoCompactThreshold

Conservador — compacta cedo demais

Boa para sessões com muito código sendo lido. Pode compactar antes da necessidade real.

Equilibrado — recomendado para uso geral

Compacta com antecipação suficiente, mantém contexto rico por mais tempo.

Agressivo — aguarda até quase esgotado

Maximiza o uso do contexto, mas corre risco de degradação antes da compactação.

💡 Como configurar

Abra ou crie o arquivo ~/.claude/settings.json e adicione a configuração. Ou peça ao próprio CC:

> Configure autoCompactThreshold para 75 no settings.json

🧠 CLAUDE.md como Âncora de Contexto

Uma das vantagens mais poderosas do CLAUDE.md: ele é carregado no início de cada sessão e sobrevive ao /compact. Isso o torna uma âncora de contexto permanente — informações que nunca se perdem, independente de quantas compactações ocorram.

⚓ O que ancorar no CLAUDE.md

Decisões arquiteturais

"Decidimos usar PostgreSQL em vez de MongoDB após análise de performance"

Padrões que o CC deve seguir

"Toda função assíncrona deve usar async/await, nunca callbacks"

Contexto de ambiente

"Ambiente de dev usa porta 8000, staging usa porta 8080"

Restrições críticas

"NUNCA modificar migrations já executadas — sempre criar nova migration"

💡 Atualizando CLAUDE.md durante a sessão

Após uma decisão importante na sessão, peça ao CC para atualizar o CLAUDE.md imediatamente:

> Adicione ao CLAUDE.md que decidimos usar Redis para cache em vez de memória local

Na próxima sessão, essa decisão já estará no contexto automaticamente.

🔄 Quando Começar Nova Conversa

Para projetos grandes, a estratégia de dividir o trabalho em sessões por feature ou componente produz resultados muito melhores do que tentar fazer tudo em uma sessão única e longa.

🗺️ Estratégia por features

Inicie a sessão da feature

CC carrega CLAUDE.md com todo o contexto do projeto. Contexto limpo, atenção total na feature.

Trabalhe até completar ou atingir um checkpoint

Use /compact proativamente. Mantenha o foco na feature atual sem desvios.

Antes de encerrar: atualize o CLAUDE.md

"Adicione ao CLAUDE.md que o módulo de autenticação foi implementado usando JWT com refresh tokens de 7 dias"

Faça commit e inicie nova sessão para a próxima feature

Nova sessão = contexto limpo + CLAUDE.md atualizado com o progresso da sessão anterior.

📊 Consumo de tokens por sessão

Uma sessão de trabalho intenso no Claude Code consome tipicamente entre 40K–80K tokens por requisição. Isso é normal — significa que o CC está trabalhando com bastante contexto de código.

Sessão leve (perguntas, análises): 10-30K tokens
Sessão típica (código + edições): 40-80K tokens
Sessão intensa (refatoração grande): 80-150K tokens

💡 Regra prática

Se uma sessão está indo bem mas mudando completamente de assunto (ex: foi frontend, agora é banco de dados), considere iniciar uma nova. Sessões focadas em um único contexto produzem resultados mais coerentes e eficientes.

✅ Resumo do Módulo 5.4

✓

Janela de contexto — histórico + arquivos + CLAUDE.md + resposta, limite fixo por modelo

✓

Sinais de degradação — CC contradiz decisões, recria código existente, pergunta coisas já respondidas

✓

/compact proativo — use a cada 10-15 mensagens, não espere a degradação aparecer

✓

autoCompactThreshold: 75 — compactação automática, sem precisar lembrar

✓

CLAUDE.md como âncora — atualize após decisões importantes para persistir o progresso

✓

Sessões por feature — contexto limpo por feature + CLAUDE.md atualizado = resultados melhores

Trilha Concluída!

Você completou a Trilha 5 — Na Prática. Agora você tem as habilidades para usar Claude Code com eficiência real em projetos profissionais.

← Módulo Anterior Voltar para Trilha 5 →