6.3 Auditoria de Contexto | Mestre em Contexto e Tokens

📊 /context — o mapa de consumo

O comando /context é a ferramenta oficial de auditoria. Ele mostra grade colorida do consumo atual, sugere otimizações e alerta sobre memory bloat. Use regularmente — idealmente ao passar 40% da janela.

Exemplo de saída visual do `/context`

sessão 50k / 200k (25%)

Context breakdown (50.123 tokens total):

System prompt

3.012 (6%)

CLAUDE.md

2.108 (4%)

MCP tools

11.045 (22%)

Skills ativas

7.022 (14%)

Arquivos lidos

14.034 (28%)

Histórico

12.902 (26%)

⚠ memory bloat warning:

• MCP "figma-mcp" loaded but unused (3.4k tokens)

• MCP "postgres-mcp" loaded but unused (2.8k tokens)

• Skill "remotion" loaded, low relevance (4.9k tokens)

💡 suggestion: disable 2 unused MCPs → save ~6.2k tokens (12% of context)

📘O que o `/context` mostra

→Grade colorida — distribuição visual por categoria (system, CLAUDE.md, MCPs, skills, arquivos, histórico)
→Memory bloat warnings — MCPs e skills carregadas mas não usadas
→Sugestões de otimização — o que desabilitar para liberar contexto
→Capacity warnings — quando você está se aproximando do limite

"Shows optimization suggestions for context-heavy tools, memory bloat, and capacity warnings."

Fonte: docs.claude.com · Commands

💡Ritual recomendado

Rode /context em 3 momentos: (1) no início de uma sessão típica do projeto, (2) quando perceber lentidão, (3) ao passar de 40% da janela. Essas 3 observações bastam para entender onde mora o custo.

📦 MCP inventory — cada servidor tem overhead

Cada servidor MCP carregado adiciona definições de tools no system prompt — mesmo se você nunca chamar essas tools na sessão. Com muitos MCPs, você pode perder 20–30% da janela só com metadados inutilizados.

Listar MCPs ativos

$ claude mcp list

# Saída aproximada:
figma-mcp          # 12 tools • ~3.4k tokens • último uso: 45 dias
postgres-mcp       # 8 tools • ~2.8k tokens • último uso: 30 dias
github-mcp        # 22 tools • ~5.1k tokens • último uso: hoje
filesystem-mcp    # 6 tools • ~1.4k tokens • último uso: hoje
slack-mcp          # 9 tools • ~2.2k tokens • último uso: 62 dias
sentry-mcp         # 14 tools • ~3.8k tokens • último uso: nunca

Total: 71 tools / ~18.7k tokens (9.4% de janela 200k)

Overhead típico por MCP (estimativas)

MCP típico	Nº de tools	Tokens aprox.	Vale a pena?
GitHub MCP	22	~5.100	Sim (uso diário)
Filesystem MCP	6	~1.400	Sim (essencial)
Figma MCP	12	~3.400	Só em projetos visuais
Postgres MCP	8	~2.800	Só em projetos DB
Sentry MCP	14	~3.800	Raramente vale o overhead
Slack MCP	9	~2.200	Ações pontuais — melhor CLI

Valores aproximados; variam com versão e tools definidas. Use /context para medir no seu caso.

📏Regra prática

Se um MCP não foi usado nos últimos 30 dias, desabilite. Pode reativar quando precisar — custo de ativar é desprezível, custo de manter é constante.

claude mcp disable figma-mcp
claude mcp disable slack-mcp
claude mcp disable sentry-mcp
# economia: ~9.4k tokens (~4.7% de janela 200k)

🛠️ Skills — quais estão ativas vs necessárias

Skills carregam sob demanda (até 5k tokens cada, budget combinado de 25k). Isso é muito melhor que MCPs, que carregam sempre. Mas ainda vale auditoria: skills que você raramente usa não precisam estar instaladas globalmente.

Listar skills disponíveis

$ claude skills

# Skills globais:
formato-curso       # ~4.8k tokens • muito usado
session-handoff     # ~3.2k tokens • muito usado
simplify            # ~2.1k tokens • usado
remotion            # ~4.9k tokens • raramente
3d-animation-creator # ~4.5k tokens • nunca usado
excalidraw-diagram  # ~3.8k tokens • 1 uso em 60 dias

# Skills do projeto (.claude/skills/):
domain-glossary     # ~2.0k tokens • sempre relevante

Total instalado: 25.3k tokens (excede budget de 25k)

✓ Skills — carga sob demanda

→Carregam apenas quando relevantes
→Até 5k tokens cada
→Budget total: 25k combinados
→Triggers em description decidem ativação

⚠️ MCPs — carga sempre

→Tools sempre no system prompt
→Overhead constante, use ou não
→Sem budget — quantos mais, mais caro
→Prefira skills quando possível

🔍Triagem de skills

Skills são "autoexplicativas": a description no frontmatter diz quando ativar. Mas isso só funciona se você conhece suas skills. Duas regras:

1.Skills globais: só as que você usa em múltiplos projetos
2.Skills do projeto: específicas em .claude/skills/

💡Regra operacional

Skills raramente usadas (≤ 1 vez/mês) não precisam estar globais. Mova para .claude/skills/ do projeto que realmente precisa, ou desinstale.

🔍 Tool definitions — quanto custam

Tools são o "custo invisível" do contexto. Cada definição JSON com schema, parâmetros, descrição pode custar 200 a 1000 tokens. MCPs com muitas tools são os piores ofensores — e raramente valem o overhead.

Anatomia de uma tool definition (MCP típico)

~380 tokens

{
  "name": "search_issues",
  "description": "Busca issues no GitHub com filtros avançados por label, assignee, status e texto. Suporta paginação e ordenação customizada. Retorna até 100 resultados por chamada.",
  "input_schema": {
    "type": "object",
    "properties": {
      "repo": { "type": "string", "description": "owner/name" },
      "query": { "type": "string" },
      "labels": { "type": "array", "items": { "type": "string" } },
      "assignee": { "type": "string" },
      "state": { "type": "string", "enum": ["open", "closed", "all"] },
      "sort": { "type": "string" },
      "per_page": { "type": "integer", "maximum": 100 }
    },
    "required": ["repo"]
  }
}

Densidade de tools por tipo

Categoria	Tokens aprox.	Exemplo
Tool simples (1–2 params)	~200	read_file, get_status
Tool média (3–5 params)	~400	create_issue, run_query
Tool complexa (6+ params, enums)	~800	search_advanced, create_pr
Tool super complexa (schemas aninhados)	~1.000+	configurar workflow CI/CD

⚠️A regra dos 10 tools

MCPs com mais de 10 tools raramente valem o overhead — ~5k tokens só em definições. Você provavelmente usa 2–3 delas; o resto é peso morto.

Exceção: MCPs centrais do fluxo (GitHub, filesystem) mesmo com muitas tools valem por uso constante. A regra é: desabilite MCPs grandes que você mal usa.

💡Alternativa: CLI direto

Para operações pontuais (abrir issue Slack, mandar mensagem), frequentemente compensa usar Bash + CLI do serviço (ex: gh issue create) em vez de carregar o MCP inteiro. Zero overhead, uma chamada.

🧹 Como enxugar: checklist prático

Teoria de auditoria não serve sem ação. Este é o checklist de 15 minutos que, em equipes reais, liberou 20–30% da janela de contexto.

Remover MCPs não usados nos últimos 30 dias

Liste com claude mcp list. Qualquer MCP com "último uso" superior a 30 dias: desabilite.

claude mcp disable <nome>

→ Economia típica: 5–15k tokens

Reduzir CLAUDE.md a < 200 linhas

Se passou de 200 linhas, tem gordura. Pergunte em cada seção: "isso mudaria a resposta do Claude se faltasse?". Se não, corte.

• Evite detalhes de "como fazer" — eles vão na conversa
• Priorize "o que não fazer" — restrições são mais valiosas
• Link externo > conteúdo embutido

→ Economia típica: 2–5k tokens

Desinstalar skills duplicadas ou obsoletas

Rode claude skills. Elimine:

• Skills com overlap (2 skills que fazem a mesma coisa)
• Skills de projetos antigos
• Skills com ≥ 60 dias sem uso

→ Liberação de budget (25k de pool compartilhado)

Não deixar arquivos grandes abertos "por precaução"

Arquivo lido = arquivo no contexto até o fim da sessão. A "precaução" de carregar tudo é exatamente o que quebra a qualidade.

• Prefira Grep para buscar antes de ler
• Leia apenas os arquivos que vai modificar
• Delegue leitura verbosa a subagentes (Haiku)

→ Economia típica: 10–30k tokens (depende do projeto)

Economia combinada típica

20–40k tokens

Em 15 minutos. Uma vez. Vale para todas as sessões futuras.

📋 Checklist mensal de auditoria

Auditar uma vez é bom; auditar todo mês é o que mantém o sistema enxuto. Este é o ritual operacional que as equipes avançadas adotam.

📅 Ritual mensal — ~30 minutos

Rodar /context no início de uma sessão típica

Use um projeto real, numa sessão real — não em um scratch vazio. Salve screenshot.

Listar MCPs e desativar os não usados

claude mcp list → disable todos com ≥ 30 dias sem uso

Revisar CLAUDE.md — está abaixo de 200 linhas?

Se passou, remova o que não mudaria comportamento do Claude

Medir custo médio por sessão (/cost)

Compare com o mês anterior. Tendência de alta? Investigar.

Revisar skills globais — remover as não usadas

Skill usada < 1× por mês → candidata a remoção

Documentar mudanças em claude-audit-YYYY-MM.md

Registro do que mudou, por quê, quanto economizou

📄 Template: `claude-audit-2026-04.md`

# Auditoria Claude Code — Abril 2026

## Baseline (medido em 2026-04-21)

- Contexto médio por sessão: 63k tokens
- Custo médio por sessão: US$ 0,85
- Sessões/semana: ~32

## MCPs desativados neste ciclo

- [x] figma-mcp — último uso há 45 dias — economia ~3.4k
- [x] slack-mcp — último uso há 62 dias — economia ~2.2k
- [x] sentry-mcp — nunca usado — economia ~3.8k

## CLAUDE.md

- Antes: 312 linhas
- Depois: 178 linhas
- Removido: seção de "how to debug" (vai virar skill)

## Skills

- Desinstalado: 3d-animation-creator, excalidraw-diagram
- Movido para projeto: remotion → só no projeto-video

## Resultado esperado

- Contexto médio: ~48k (−24%)
- Custo médio: ~US$ 0,55 (−35%)

## Próxima auditoria

2026-05-21

A verdade operacional

Contexto enxuto é hábito, não evento.

30 min por mês mantêm o sistema leve por todo mês seguinte.

🎯Hoje, antes de fechar essa página

1.Abra o Claude Code no seu projeto real
2.Rode /context — tire screenshot
3.Aplique o checklist de 15 minutos do Tópico 5
4.Rode /context de novo — compare
5.Agende a próxima auditoria para daqui a 30 dias

🎯 Rotina de contexto limpo com skill de memória

A técnica mais avançada de gestão de contexto: skill customizada que encapsula salvamento + reload, convertendo /clear numa operação mais barata que /compact em quase todo caso prático.

Regra avançada

Com memória salva, /clear > /compact

Porque /clear devolve um prefixo estável (= cache limpo). /compact injeta resumo novo = cache invalidado.

Exemplo: skill `save-context`

Crie em .claude/skills/save-context/SKILL.md:

---
name: save-context
description: Organiza MEMORY.md + arquivos de apoio antes de /clear.
  Use quando quiser reiniciar sessão sem perder estado.
---

# Save Context

Ao ser invocada:

1. Crie/atualize `MEMORY.md` na raiz do projeto com:
   - Objetivo atual (1 linha)
   - Decisões tomadas (lista)
   - Arquivos tocados (caminhos absolutos)
   - Próxima ação (1 linha)

2. Se houver plan/todo ativos, garanta que
   `plan.md` e `todo.md` estão atualizados.

3. Reporte ao usuário: "Memória salva. Pode rodar /clear."

Custo: /clear + skill vs /compact repetido

Cenário (50k tokens base, 40 turnos total)	Cache hit médio	Custo estimado
/compact a cada 10 turnos resumo invalida parte do cache a cada compact	~55%	US$ 2,80
/clear + skill a cada 15 turnos prefixo limpo, cache fresco a cada ciclo	~80%	US$ 0,95

~3× mais barato no mesmo volume de trabalho. Mesmo modelo, mesmo projeto.

✓ Prefira /clear + skill

• Projetos recorrentes (daily)
• Contexto >40k tokens
• Estado bem definido (tem arquivos)
• Vai continuar "amanhã"

~ Prefira /compact

• Sessão continua agora
• Decisão técnica fluindo
• Sem skill configurada
• Contexto <30k tokens

↩ Prefira /rewind

• Passo deu errado
• Quer testar hipótese alternativa
• Arquivos em estado ruim
• Reset cirúrgico

🔁Ciclo completo (rotina diária)

1. Abro sessão → Claude lê MEMORY.md automaticamente
2. Trabalho ~15–20 turnos
3. Invoco skill save-context
4. /clear
5. Volta para passo 1

Esse é o pattern de devs que rodam Claude Code 4+ horas/dia com custo previsível e estável.

📋Resumo do Módulo

✓

/context = o mapa — grade colorida, memory bloat warnings, sugestões

✓

MCPs sempre custam — definições no system mesmo se não usadas; audite com claude mcp list

✓

Skills carregam sob demanda — até 5k cada, budget 25k; triagem periódica

✓

Tools custam 200–1000 tokens — MCPs com > 10 tools raramente valem

✓

Checklist de 15 min — remover MCPs, reduzir CLAUDE.md, limpar skills, não abrir arquivos por precaução

✓

Ritual mensal — documentar em claude-audit-YYYY-MM.md

Você concluiu a Trilha 6 — Nível Avançado 🚀

Parabéns. Você domina caching, orquestração multi-modelo e auditoria.

A última peça é disciplina: aplicar isso no dia a dia. Mãos à obra.

← Módulo Anterior Voltar para Landing →