📊 /context — o mapa de consumo
O comando /context é a ferramenta oficial de auditoria. Ele mostra grade colorida do consumo atual, sugere otimizações e alerta sobre memory bloat. Use regularmente — idealmente ao passar 40% da janela.
Exemplo de saída visual do /context
sessão 50k / 200k (25%)
📘O que o /context mostra
- →Grade colorida — distribuição visual por categoria (system, CLAUDE.md, MCPs, skills, arquivos, histórico)
- →Memory bloat warnings — MCPs e skills carregadas mas não usadas
- →Sugestões de otimização — o que desabilitar para liberar contexto
- →Capacity warnings — quando você está se aproximando do limite
"Shows optimization suggestions for context-heavy tools, memory bloat, and capacity warnings."
Fonte: docs.claude.com · Commands
💡Ritual recomendado
Rode /context em 3 momentos: (1) no início de uma sessão típica do projeto, (2) quando perceber lentidão, (3) ao passar de 40% da janela. Essas 3 observações bastam para entender onde mora o custo.
📦 MCP inventory — cada servidor tem overhead
Cada servidor MCP carregado adiciona definições de tools no system prompt — mesmo se você nunca chamar essas tools na sessão. Com muitos MCPs, você pode perder 20–30% da janela só com metadados inutilizados.
Listar MCPs ativos
$ claude mcp list
# Saída aproximada:
figma-mcp # 12 tools • ~3.4k tokens • último uso: 45 dias
postgres-mcp # 8 tools • ~2.8k tokens • último uso: 30 dias
github-mcp # 22 tools • ~5.1k tokens • último uso: hoje
filesystem-mcp # 6 tools • ~1.4k tokens • último uso: hoje
slack-mcp # 9 tools • ~2.2k tokens • último uso: 62 dias
sentry-mcp # 14 tools • ~3.8k tokens • último uso: nunca
Total: 71 tools / ~18.7k tokens (9.4% de janela 200k)
Overhead típico por MCP (estimativas)
| MCP típico | Nº de tools | Tokens aprox. | Vale a pena? |
|---|---|---|---|
| GitHub MCP | 22 | ~5.100 | Sim (uso diário) |
| Filesystem MCP | 6 | ~1.400 | Sim (essencial) |
| Figma MCP | 12 | ~3.400 | Só em projetos visuais |
| Postgres MCP | 8 | ~2.800 | Só em projetos DB |
| Sentry MCP | 14 | ~3.800 | Raramente vale o overhead |
| Slack MCP | 9 | ~2.200 | Ações pontuais — melhor CLI |
Valores aproximados; variam com versão e tools definidas. Use /context para medir no seu caso.
📏Regra prática
Se um MCP não foi usado nos últimos 30 dias, desabilite. Pode reativar quando precisar — custo de ativar é desprezível, custo de manter é constante.
claude mcp disable slack-mcp
claude mcp disable sentry-mcp
# economia: ~9.4k tokens (~4.7% de janela 200k)
🛠️ Skills — quais estão ativas vs necessárias
Skills carregam sob demanda (até 5k tokens cada, budget combinado de 25k). Isso é muito melhor que MCPs, que carregam sempre. Mas ainda vale auditoria: skills que você raramente usa não precisam estar instaladas globalmente.
Listar skills disponíveis
$ claude skills
# Skills globais:
formato-curso # ~4.8k tokens • muito usado
session-handoff # ~3.2k tokens • muito usado
simplify # ~2.1k tokens • usado
remotion # ~4.9k tokens • raramente
3d-animation-creator # ~4.5k tokens • nunca usado
excalidraw-diagram # ~3.8k tokens • 1 uso em 60 dias
# Skills do projeto (.claude/skills/):
domain-glossary # ~2.0k tokens • sempre relevante
Total instalado: 25.3k tokens (excede budget de 25k)
✓ Skills — carga sob demanda
- →Carregam apenas quando relevantes
- →Até 5k tokens cada
- →Budget total: 25k combinados
- →Triggers em description decidem ativação
⚠️ MCPs — carga sempre
- →Tools sempre no system prompt
- →Overhead constante, use ou não
- →Sem budget — quantos mais, mais caro
- →Prefira skills quando possível
🔍Triagem de skills
Skills são "autoexplicativas": a description no frontmatter diz quando ativar. Mas isso só funciona se você conhece suas skills. Duas regras:
- 1.Skills globais: só as que você usa em múltiplos projetos
- 2.Skills do projeto: específicas em
.claude/skills/
💡Regra operacional
Skills raramente usadas (≤ 1 vez/mês) não precisam estar globais. Mova para .claude/skills/ do projeto que realmente precisa, ou desinstale.
🔍 Tool definitions — quanto custam
Tools são o "custo invisível" do contexto. Cada definição JSON com schema, parâmetros, descrição pode custar 200 a 1000 tokens. MCPs com muitas tools são os piores ofensores — e raramente valem o overhead.
Anatomia de uma tool definition (MCP típico)
~380 tokens{
"name": "search_issues",
"description": "Busca issues no GitHub com filtros avançados por label, assignee, status e texto. Suporta paginação e ordenação customizada. Retorna até 100 resultados por chamada.",
"input_schema": {
"type": "object",
"properties": {
"repo": { "type": "string", "description": "owner/name" },
"query": { "type": "string" },
"labels": { "type": "array", "items": { "type": "string" } },
"assignee": { "type": "string" },
"state": { "type": "string", "enum": ["open", "closed", "all"] },
"sort": { "type": "string" },
"per_page": { "type": "integer", "maximum": 100 }
},
"required": ["repo"]
}
}
Densidade de tools por tipo
| Categoria | Tokens aprox. | Exemplo |
|---|---|---|
| Tool simples (1–2 params) | ~200 | read_file, get_status |
| Tool média (3–5 params) | ~400 | create_issue, run_query |
| Tool complexa (6+ params, enums) | ~800 | search_advanced, create_pr |
| Tool super complexa (schemas aninhados) | ~1.000+ | configurar workflow CI/CD |
⚠️A regra dos 10 tools
MCPs com mais de 10 tools raramente valem o overhead — ~5k tokens só em definições. Você provavelmente usa 2–3 delas; o resto é peso morto.
Exceção: MCPs centrais do fluxo (GitHub, filesystem) mesmo com muitas tools valem por uso constante. A regra é: desabilite MCPs grandes que você mal usa.
💡Alternativa: CLI direto
Para operações pontuais (abrir issue Slack, mandar mensagem), frequentemente compensa usar Bash + CLI do serviço (ex: gh issue create) em vez de carregar o MCP inteiro. Zero overhead, uma chamada.
🧹 Como enxugar: checklist prático
Teoria de auditoria não serve sem ação. Este é o checklist de 15 minutos que, em equipes reais, liberou 20–30% da janela de contexto.
Remover MCPs não usados nos últimos 30 dias
Liste com claude mcp list. Qualquer MCP com "último uso" superior a 30 dias: desabilite.
→ Economia típica: 5–15k tokens
Reduzir CLAUDE.md a < 200 linhas
Se passou de 200 linhas, tem gordura. Pergunte em cada seção: "isso mudaria a resposta do Claude se faltasse?". Se não, corte.
- • Evite detalhes de "como fazer" — eles vão na conversa
- • Priorize "o que não fazer" — restrições são mais valiosas
- • Link externo > conteúdo embutido
→ Economia típica: 2–5k tokens
Desinstalar skills duplicadas ou obsoletas
Rode claude skills. Elimine:
- • Skills com overlap (2 skills que fazem a mesma coisa)
- • Skills de projetos antigos
- • Skills com ≥ 60 dias sem uso
→ Liberação de budget (25k de pool compartilhado)
Não deixar arquivos grandes abertos "por precaução"
Arquivo lido = arquivo no contexto até o fim da sessão. A "precaução" de carregar tudo é exatamente o que quebra a qualidade.
- • Prefira
Greppara buscar antes de ler - • Leia apenas os arquivos que vai modificar
- • Delegue leitura verbosa a subagentes (Haiku)
→ Economia típica: 10–30k tokens (depende do projeto)
Em 15 minutos. Uma vez. Vale para todas as sessões futuras.
📋 Checklist mensal de auditoria
Auditar uma vez é bom; auditar todo mês é o que mantém o sistema enxuto. Este é o ritual operacional que as equipes avançadas adotam.
📅 Ritual mensal — ~30 minutos
📄 Template: claude-audit-2026-04.md
# Auditoria Claude Code — Abril 2026
## Baseline (medido em 2026-04-21)
- Contexto médio por sessão: 63k tokens
- Custo médio por sessão: US$ 0,85
- Sessões/semana: ~32
## MCPs desativados neste ciclo
- [x] figma-mcp — último uso há 45 dias — economia ~3.4k
- [x] slack-mcp — último uso há 62 dias — economia ~2.2k
- [x] sentry-mcp — nunca usado — economia ~3.8k
## CLAUDE.md
- Antes: 312 linhas
- Depois: 178 linhas
- Removido: seção de "how to debug" (vai virar skill)
## Skills
- Desinstalado: 3d-animation-creator, excalidraw-diagram
- Movido para projeto: remotion → só no projeto-video
## Resultado esperado
- Contexto médio: ~48k (−24%)
- Custo médio: ~US$ 0,55 (−35%)
## Próxima auditoria
2026-05-21
Contexto enxuto é hábito, não evento.
30 min por mês mantêm o sistema leve por todo mês seguinte.
🎯Hoje, antes de fechar essa página
- 1.Abra o Claude Code no seu projeto real
- 2.Rode
/context— tire screenshot - 3.Aplique o checklist de 15 minutos do Tópico 5
- 4.Rode
/contextde novo — compare - 5.Agende a próxima auditoria para daqui a 30 dias
🎯 Rotina de contexto limpo com skill de memória
A técnica mais avançada de gestão de contexto: skill customizada que encapsula salvamento + reload, convertendo /clear numa operação mais barata que /compact em quase todo caso prático.
Com memória salva, /clear > /compact
Porque /clear devolve um prefixo estável (= cache limpo). /compact injeta resumo novo = cache invalidado.
Exemplo: skill save-context
Crie em .claude/skills/save-context/SKILL.md:
---
name: save-context
description: Organiza MEMORY.md + arquivos de apoio antes de /clear.
Use quando quiser reiniciar sessão sem perder estado.
---
# Save Context
Ao ser invocada:
1. Crie/atualize `MEMORY.md` na raiz do projeto com:
- Objetivo atual (1 linha)
- Decisões tomadas (lista)
- Arquivos tocados (caminhos absolutos)
- Próxima ação (1 linha)
2. Se houver plan/todo ativos, garanta que
`plan.md` e `todo.md` estão atualizados.
3. Reporte ao usuário: "Memória salva. Pode rodar /clear."
Custo: /clear + skill vs /compact repetido
| Cenário (50k tokens base, 40 turnos total) | Cache hit médio | Custo estimado |
|---|---|---|
| /compact a cada 10 turnos resumo invalida parte do cache a cada compact |
~55% | US$ 2,80 |
| /clear + skill a cada 15 turnos prefixo limpo, cache fresco a cada ciclo |
~80% | US$ 0,95 |
~3× mais barato no mesmo volume de trabalho. Mesmo modelo, mesmo projeto.
✓ Prefira /clear + skill
- • Projetos recorrentes (daily)
- • Contexto >40k tokens
- • Estado bem definido (tem arquivos)
- • Vai continuar "amanhã"
~ Prefira /compact
- • Sessão continua agora
- • Decisão técnica fluindo
- • Sem skill configurada
- • Contexto <30k tokens
↩ Prefira /rewind
- • Passo deu errado
- • Quer testar hipótese alternativa
- • Arquivos em estado ruim
- • Reset cirúrgico
🔁Ciclo completo (rotina diária)
- 1. Abro sessão → Claude lê
MEMORY.mdautomaticamente - 2. Trabalho ~15–20 turnos
- 3. Invoco skill
save-context - 4.
/clear - 5. Volta para passo 1
Esse é o pattern de devs que rodam Claude Code 4+ horas/dia com custo previsível e estável.
📋Resumo do Módulo
claude mcp listclaude-audit-YYYY-MM.mdVocê concluiu a Trilha 6 — Nível Avançado 🚀
Parabéns. Você domina caching, orquestração multi-modelo e auditoria.
A última peça é disciplina: aplicar isso no dia a dia. Mãos à obra.