MÓDULO 5.4

🧠 Gerenciando o Contexto

Contexto é o recurso mais valioso do Claude Code. Aprenda a gerenciá-lo para sessões longas, projetos grandes e uso eficiente de tokens.

6
Tópicos
25
Minutos
Inter.
Nível
Config.
Tipo
1

🪟 O que é Janela de Contexto

A janela de contexto é o limite máximo de texto que o modelo pode processar em uma única requisição. Ela inclui todo o histórico da conversa, os arquivos abertos, o CLAUDE.md e a resposta que será gerada. Quando atinge o limite, algo precisa ser descartado.

📊 O que consome contexto em uma sessão

Suas mensagens
~15%
Respostas do CC
~35%
Arquivos lidos
~40%
CLAUDE.md
~5%
Outros
~5%

Distribuição aproximada em uma sessão típica de trabalho

📋 Limites dos modelos Claude

Claude Sonnet 4.6

200K

tokens de contexto

Uso típico por req.

40-80K

tokens por requisição

1K tokens ≈

~750

palavras em inglês

2

📉 Quando o Contexto Enche

Quando o contexto se aproxima do limite, o CC começa a "esquecer" partes antigas da conversa. Isso causa comportamentos inconsistentes que parecem erros do modelo — mas na verdade é falta de contexto. Reconhecer os sinais cedo é essencial.

⚠️ Sinais de contexto degradado

  • CC contradiz decisões tomadas 10+ mensagens atrás
  • CC "recria" variáveis ou funções que já existem no projeto
  • CC pergunta coisas que você já respondeu na sessão
  • Respostas ficam mais genéricas e menos específicas ao projeto
  • CC ignora convenções definidas no início da sessão
  • Código gerado não segue o estilo do projeto

💡 Ação quando notar degradação

Quando perceber qualquer um desses sinais: execute /compact imediatamente ou inicie uma nova sessão. Continuar com contexto degradado produz resultado de má qualidade e desperdiça tokens.

3

🗜️ Usando /compact

O comando /compact pede ao CC para criar um sumário compacto de toda a conversa, substituindo o histórico longo por um resumo eficiente. As decisões importantes são preservadas; o texto verboso é descartado.

🗜️ Como /compact funciona

1

Você digita /compact

O CC analisa todo o histórico da conversa atual

2

CC gera um sumário

Preserva: decisões tomadas, código relevante, contexto ativo. Descarta: repetições, perguntas já respondidas, discussões resolvidas

3

Contexto liberado

A sessão continua com muito mais espaço disponível — como um "refresh" sem perder o progresso

✓ Use /compact quando

  • A sessão está com 10+ mensagens de trabalho intenso
  • Antes de começar uma tarefa complexa nova
  • Proativamente, sem esperar sinais de degradação

✗ /compact não resolve

  • Contexto já completamente esgotado — use /clear e nova sessão
  • Arquivos muito grandes abertos no contexto
  • Necessidade de memória perfeita de todas as mensagens
4

⚙️ autoCompactThreshold

Em vez de lembrar de usar /compact, configure o autoCompactThreshold no settings.json. Quando o contexto atingir a porcentagem configurada, o CC compacta automaticamente — sem interromper seu fluxo.

~/.claude/settings.json Configuração recomendada
{
  "autoCompactThreshold": 75,
  // Compacta automaticamente aos 75% do contexto

  "env": {
    // Para uso com Ollama (Trilha 3)
    "ANTHROPIC_BASE_URL": "http://localhost:11434",
    "ANTHROPIC_AUTH_TOKEN": "ollama"
  }
}

Guia de valores para autoCompactThreshold

50

Conservador — compacta cedo demais

Boa para sessões com muito código sendo lido. Pode compactar antes da necessidade real.

75

Equilibrado — recomendado para uso geral

Compacta com antecipação suficiente, mantém contexto rico por mais tempo.

90

Agressivo — aguarda até quase esgotado

Maximiza o uso do contexto, mas corre risco de degradação antes da compactação.

💡 Como configurar

Abra ou crie o arquivo ~/.claude/settings.json e adicione a configuração. Ou peça ao próprio CC:

> Configure autoCompactThreshold para 75 no settings.json
5

🧠 CLAUDE.md como Âncora de Contexto

Uma das vantagens mais poderosas do CLAUDE.md: ele é carregado no início de cada sessão e sobrevive ao /compact. Isso o torna uma âncora de contexto permanente — informações que nunca se perdem, independente de quantas compactações ocorram.

O que ancorar no CLAUDE.md

Decisões arquiteturais

"Decidimos usar PostgreSQL em vez de MongoDB após análise de performance"

Padrões que o CC deve seguir

"Toda função assíncrona deve usar async/await, nunca callbacks"

Contexto de ambiente

"Ambiente de dev usa porta 8000, staging usa porta 8080"

Restrições críticas

"NUNCA modificar migrations já executadas — sempre criar nova migration"

💡 Atualizando CLAUDE.md durante a sessão

Após uma decisão importante na sessão, peça ao CC para atualizar o CLAUDE.md imediatamente:

> Adicione ao CLAUDE.md que decidimos usar Redis para cache em vez de memória local

Na próxima sessão, essa decisão já estará no contexto automaticamente.

6

🔄 Quando Começar Nova Conversa

Para projetos grandes, a estratégia de dividir o trabalho em sessões por feature ou componente produz resultados muito melhores do que tentar fazer tudo em uma sessão única e longa.

🗺️ Estratégia por features

1

Inicie a sessão da feature

CC carrega CLAUDE.md com todo o contexto do projeto. Contexto limpo, atenção total na feature.

2

Trabalhe até completar ou atingir um checkpoint

Use /compact proativamente. Mantenha o foco na feature atual sem desvios.

3

Antes de encerrar: atualize o CLAUDE.md

"Adicione ao CLAUDE.md que o módulo de autenticação foi implementado usando JWT com refresh tokens de 7 dias"

4

Faça commit e inicie nova sessão para a próxima feature

Nova sessão = contexto limpo + CLAUDE.md atualizado com o progresso da sessão anterior.

📊 Consumo de tokens por sessão

Uma sessão de trabalho intenso no Claude Code consome tipicamente entre 40K–80K tokens por requisição. Isso é normal — significa que o CC está trabalhando com bastante contexto de código.

  • Sessão leve (perguntas, análises): 10-30K tokens
  • Sessão típica (código + edições): 40-80K tokens
  • Sessão intensa (refatoração grande): 80-150K tokens

💡 Regra prática

Se uma sessão está indo bem mas mudando completamente de assunto (ex: foi frontend, agora é banco de dados), considere iniciar uma nova. Sessões focadas em um único contexto produzem resultados mais coerentes e eficientes.

Resumo do Módulo 5.4

Janela de contexto — histórico + arquivos + CLAUDE.md + resposta, limite fixo por modelo
Sinais de degradação — CC contradiz decisões, recria código existente, pergunta coisas já respondidas
/compact proativo — use a cada 10-15 mensagens, não espere a degradação aparecer
autoCompactThreshold: 75 — compactação automática, sem precisar lembrar
CLAUDE.md como âncora — atualize após decisões importantes para persistir o progresso
Sessões por feature — contexto limpo por feature + CLAUDE.md atualizado = resultados melhores

Trilha Concluída!

Você completou a Trilha 5 — Na Prática. Agora você tem as habilidades para usar Claude Code com eficiência real em projetos profissionais.