MÓDULO 6.3 AVANÇADO

🔬 Auditoria de Contexto

O que está comendo seu contexto? MCPs ociosos? Skills duplicadas? CLAUDE.md inchado? Descubra com o /context, meça, e corte com precisão cirúrgica.

7
Tópicos
30
Minutos
Avançado
Nível
Operacional
Tipo
1

📊 /context — o mapa de consumo

O comando /context é a ferramenta oficial de auditoria. Ele mostra grade colorida do consumo atual, sugere otimizações e alerta sobre memory bloat. Use regularmente — idealmente ao passar 40% da janela.

Exemplo de saída visual do /context

sessão 50k / 200k (25%)
Context breakdown (50.123 tokens total):
System prompt
3.012 (6%)
CLAUDE.md
2.108 (4%)
MCP tools
11.045 (22%)
Skills ativas
7.022 (14%)
Arquivos lidos
14.034 (28%)
Histórico
12.902 (26%)
⚠ memory bloat warning:
• MCP "figma-mcp" loaded but unused (3.4k tokens)
• MCP "postgres-mcp" loaded but unused (2.8k tokens)
• Skill "remotion" loaded, low relevance (4.9k tokens)
💡 suggestion: disable 2 unused MCPs → save ~6.2k tokens (12% of context)

📘O que o /context mostra

  • Grade colorida — distribuição visual por categoria (system, CLAUDE.md, MCPs, skills, arquivos, histórico)
  • Memory bloat warnings — MCPs e skills carregadas mas não usadas
  • Sugestões de otimização — o que desabilitar para liberar contexto
  • Capacity warnings — quando você está se aproximando do limite
"Shows optimization suggestions for context-heavy tools, memory bloat, and capacity warnings."

Fonte: docs.claude.com · Commands

💡Ritual recomendado

Rode /context em 3 momentos: (1) no início de uma sessão típica do projeto, (2) quando perceber lentidão, (3) ao passar de 40% da janela. Essas 3 observações bastam para entender onde mora o custo.

2

📦 MCP inventory — cada servidor tem overhead

Cada servidor MCP carregado adiciona definições de tools no system prompt — mesmo se você nunca chamar essas tools na sessão. Com muitos MCPs, você pode perder 20–30% da janela só com metadados inutilizados.

Listar MCPs ativos

$ claude mcp list

# Saída aproximada:
figma-mcp          # 12 tools • ~3.4k tokens • último uso: 45 dias
postgres-mcp       # 8 tools • ~2.8k tokens • último uso: 30 dias
github-mcp        # 22 tools • ~5.1k tokens • último uso: hoje
filesystem-mcp    # 6 tools • ~1.4k tokens • último uso: hoje
slack-mcp          # 9 tools • ~2.2k tokens • último uso: 62 dias
sentry-mcp         # 14 tools • ~3.8k tokens • último uso: nunca

Total: 71 tools / ~18.7k tokens (9.4% de janela 200k)

Overhead típico por MCP (estimativas)

MCP típico Nº de tools Tokens aprox. Vale a pena?
GitHub MCP22~5.100Sim (uso diário)
Filesystem MCP6~1.400Sim (essencial)
Figma MCP12~3.400Só em projetos visuais
Postgres MCP8~2.800Só em projetos DB
Sentry MCP14~3.800Raramente vale o overhead
Slack MCP9~2.200Ações pontuais — melhor CLI

Valores aproximados; variam com versão e tools definidas. Use /context para medir no seu caso.

📏Regra prática

Se um MCP não foi usado nos últimos 30 dias, desabilite. Pode reativar quando precisar — custo de ativar é desprezível, custo de manter é constante.

claude mcp disable figma-mcp
claude mcp disable slack-mcp
claude mcp disable sentry-mcp
# economia: ~9.4k tokens (~4.7% de janela 200k)
3

🛠️ Skills — quais estão ativas vs necessárias

Skills carregam sob demanda (até 5k tokens cada, budget combinado de 25k). Isso é muito melhor que MCPs, que carregam sempre. Mas ainda vale auditoria: skills que você raramente usa não precisam estar instaladas globalmente.

Listar skills disponíveis

$ claude skills

# Skills globais:
formato-curso       # ~4.8k tokens • muito usado
session-handoff     # ~3.2k tokens • muito usado
simplify            # ~2.1k tokens • usado
remotion            # ~4.9k tokens • raramente
3d-animation-creator # ~4.5k tokens • nunca usado
excalidraw-diagram  # ~3.8k tokens • 1 uso em 60 dias

# Skills do projeto (.claude/skills/):
domain-glossary     # ~2.0k tokens • sempre relevante

Total instalado: 25.3k tokens (excede budget de 25k)

✓ Skills — carga sob demanda

  • Carregam apenas quando relevantes
  • Até 5k tokens cada
  • Budget total: 25k combinados
  • Triggers em description decidem ativação

⚠️ MCPs — carga sempre

  • Tools sempre no system prompt
  • Overhead constante, use ou não
  • Sem budget — quantos mais, mais caro
  • Prefira skills quando possível

🔍Triagem de skills

Skills são "autoexplicativas": a description no frontmatter diz quando ativar. Mas isso só funciona se você conhece suas skills. Duas regras:

  1. 1.Skills globais: só as que você usa em múltiplos projetos
  2. 2.Skills do projeto: específicas em .claude/skills/

💡Regra operacional

Skills raramente usadas (≤ 1 vez/mês) não precisam estar globais. Mova para .claude/skills/ do projeto que realmente precisa, ou desinstale.

4

🔍 Tool definitions — quanto custam

Tools são o "custo invisível" do contexto. Cada definição JSON com schema, parâmetros, descrição pode custar 200 a 1000 tokens. MCPs com muitas tools são os piores ofensores — e raramente valem o overhead.

Anatomia de uma tool definition (MCP típico)

~380 tokens
{
  "name": "search_issues",
  "description": "Busca issues no GitHub com filtros avançados por label, assignee, status e texto. Suporta paginação e ordenação customizada. Retorna até 100 resultados por chamada.",
  "input_schema": {
    "type": "object",
    "properties": {
      "repo": { "type": "string", "description": "owner/name" },
      "query": { "type": "string" },
      "labels": { "type": "array", "items": { "type": "string" } },
      "assignee": { "type": "string" },
      "state": { "type": "string", "enum": ["open", "closed", "all"] },
      "sort": { "type": "string" },
      "per_page": { "type": "integer", "maximum": 100 }
    },
    "required": ["repo"]
  }
}

Densidade de tools por tipo

Categoria Tokens aprox. Exemplo
Tool simples (1–2 params)~200read_file, get_status
Tool média (3–5 params)~400create_issue, run_query
Tool complexa (6+ params, enums)~800search_advanced, create_pr
Tool super complexa (schemas aninhados)~1.000+configurar workflow CI/CD

⚠️A regra dos 10 tools

MCPs com mais de 10 tools raramente valem o overhead — ~5k tokens só em definições. Você provavelmente usa 2–3 delas; o resto é peso morto.

Exceção: MCPs centrais do fluxo (GitHub, filesystem) mesmo com muitas tools valem por uso constante. A regra é: desabilite MCPs grandes que você mal usa.

💡Alternativa: CLI direto

Para operações pontuais (abrir issue Slack, mandar mensagem), frequentemente compensa usar Bash + CLI do serviço (ex: gh issue create) em vez de carregar o MCP inteiro. Zero overhead, uma chamada.

5

🧹 Como enxugar: checklist prático

Teoria de auditoria não serve sem ação. Este é o checklist de 15 minutos que, em equipes reais, liberou 20–30% da janela de contexto.

1

Remover MCPs não usados nos últimos 30 dias

Liste com claude mcp list. Qualquer MCP com "último uso" superior a 30 dias: desabilite.

claude mcp disable <nome>

→ Economia típica: 5–15k tokens

2

Reduzir CLAUDE.md a < 200 linhas

Se passou de 200 linhas, tem gordura. Pergunte em cada seção: "isso mudaria a resposta do Claude se faltasse?". Se não, corte.

  • • Evite detalhes de "como fazer" — eles vão na conversa
  • • Priorize "o que não fazer" — restrições são mais valiosas
  • • Link externo > conteúdo embutido

→ Economia típica: 2–5k tokens

3

Desinstalar skills duplicadas ou obsoletas

Rode claude skills. Elimine:

  • • Skills com overlap (2 skills que fazem a mesma coisa)
  • • Skills de projetos antigos
  • • Skills com ≥ 60 dias sem uso

→ Liberação de budget (25k de pool compartilhado)

4

Não deixar arquivos grandes abertos "por precaução"

Arquivo lido = arquivo no contexto até o fim da sessão. A "precaução" de carregar tudo é exatamente o que quebra a qualidade.

  • • Prefira Grep para buscar antes de ler
  • • Leia apenas os arquivos que vai modificar
  • • Delegue leitura verbosa a subagentes (Haiku)

→ Economia típica: 10–30k tokens (depende do projeto)

Economia combinada típica
20–40k tokens

Em 15 minutos. Uma vez. Vale para todas as sessões futuras.

6

📋 Checklist mensal de auditoria

Auditar uma vez é bom; auditar todo mês é o que mantém o sistema enxuto. Este é o ritual operacional que as equipes avançadas adotam.

📅 Ritual mensal — ~30 minutos

📄 Template: claude-audit-2026-04.md

# Auditoria Claude Code — Abril 2026

## Baseline (medido em 2026-04-21)

- Contexto médio por sessão: 63k tokens
- Custo médio por sessão: US$ 0,85
- Sessões/semana: ~32

## MCPs desativados neste ciclo

- [x] figma-mcp — último uso há 45 dias — economia ~3.4k
- [x] slack-mcp — último uso há 62 dias — economia ~2.2k
- [x] sentry-mcp — nunca usado — economia ~3.8k

## CLAUDE.md

- Antes: 312 linhas
- Depois: 178 linhas
- Removido: seção de "how to debug" (vai virar skill)

## Skills

- Desinstalado: 3d-animation-creator, excalidraw-diagram
- Movido para projeto: remotion → só no projeto-video

## Resultado esperado

- Contexto médio: ~48k (−24%)
- Custo médio: ~US$ 0,55 (−35%)

## Próxima auditoria

2026-05-21
A verdade operacional

Contexto enxuto é hábito, não evento.

30 min por mês mantêm o sistema leve por todo mês seguinte.

🎯Hoje, antes de fechar essa página

  1. 1.Abra o Claude Code no seu projeto real
  2. 2.Rode /context — tire screenshot
  3. 3.Aplique o checklist de 15 minutos do Tópico 5
  4. 4.Rode /context de novo — compare
  5. 5.Agende a próxima auditoria para daqui a 30 dias
7

🎯 Rotina de contexto limpo com skill de memória

A técnica mais avançada de gestão de contexto: skill customizada que encapsula salvamento + reload, convertendo /clear numa operação mais barata que /compact em quase todo caso prático.

Regra avançada

Com memória salva, /clear > /compact

Porque /clear devolve um prefixo estável (= cache limpo). /compact injeta resumo novo = cache invalidado.

Exemplo: skill save-context

Crie em .claude/skills/save-context/SKILL.md:

---
name: save-context
description: Organiza MEMORY.md + arquivos de apoio antes de /clear.
  Use quando quiser reiniciar sessão sem perder estado.
---

# Save Context

Ao ser invocada:

1. Crie/atualize `MEMORY.md` na raiz do projeto com:
   - Objetivo atual (1 linha)
   - Decisões tomadas (lista)
   - Arquivos tocados (caminhos absolutos)
   - Próxima ação (1 linha)

2. Se houver plan/todo ativos, garanta que
   `plan.md` e `todo.md` estão atualizados.

3. Reporte ao usuário: "Memória salva. Pode rodar /clear."

Custo: /clear + skill vs /compact repetido

Cenário (50k tokens base, 40 turnos total) Cache hit médio Custo estimado
/compact a cada 10 turnos
resumo invalida parte do cache a cada compact
~55% US$ 2,80
/clear + skill a cada 15 turnos
prefixo limpo, cache fresco a cada ciclo
~80% US$ 0,95

~3× mais barato no mesmo volume de trabalho. Mesmo modelo, mesmo projeto.

✓ Prefira /clear + skill

  • • Projetos recorrentes (daily)
  • • Contexto >40k tokens
  • • Estado bem definido (tem arquivos)
  • • Vai continuar "amanhã"

~ Prefira /compact

  • • Sessão continua agora
  • • Decisão técnica fluindo
  • • Sem skill configurada
  • • Contexto <30k tokens

↩ Prefira /rewind

  • • Passo deu errado
  • • Quer testar hipótese alternativa
  • • Arquivos em estado ruim
  • • Reset cirúrgico

🔁Ciclo completo (rotina diária)

  1. 1. Abro sessão → Claude lê MEMORY.md automaticamente
  2. 2. Trabalho ~15–20 turnos
  3. 3. Invoco skill save-context
  4. 4. /clear
  5. 5. Volta para passo 1

Esse é o pattern de devs que rodam Claude Code 4+ horas/dia com custo previsível e estável.

📋Resumo do Módulo

/context = o mapa — grade colorida, memory bloat warnings, sugestões
MCPs sempre custam — definições no system mesmo se não usadas; audite com claude mcp list
Skills carregam sob demanda — até 5k cada, budget 25k; triagem periódica
Tools custam 200–1000 tokens — MCPs com > 10 tools raramente valem
Checklist de 15 min — remover MCPs, reduzir CLAUDE.md, limpar skills, não abrir arquivos por precaução
Ritual mensal — documentar em claude-audit-YYYY-MM.md

Você concluiu a Trilha 6 — Nível Avançado 🚀

Parabéns. Você domina caching, orquestração multi-modelo e auditoria.

A última peça é disciplina: aplicar isso no dia a dia. Mãos à obra.