Conteúdo Detalhado
🤖 Delegar para Subagentes
Cada subagente tem contexto próprio. O principal fica limpo. Pesquisas verbosas não poluem mais seu trabalho.
Um agente invocado pelo agente principal que roda em sua própria janela de contexto, com system prompt customizado, tools específicas e permissões independentes. Começa sempre do zero.
Delegar tarefa A ao subagente significa que tudo que ele ler ou gerar NÃO vai poluir o contexto principal. O pai só recebe o resumo final.
Documentação oficial: "Each subagent runs in its own context window with a custom system prompt, specific tool access, and independent permissions."
Qualquer operação verbosa onde só o resumo final importa: pesquisar 20 arquivos, analisar um PDF gigante, varrer logs, fazer síntese de documentos, web research.
Se você está prestes a encher a tela de saídas, é forte sinal de que a tarefa devia ser delegada. O principal nunca deveria ser "depósito" de output bruto.
Regra: se o resultado cabe em 300 palavras, mas o caminho lê 50k tokens — delegue.
Explore (busca rápida no repo), general-purpose (tarefas multi-step), web-research-assistant (pesquisa web profunda), Plan (cria plano de execução), code-reviewer (auditoria de diff).
Escolher o certo muda eficiência e custo. Explore é barato e rápido; general-purpose é versátil mas caro; research tem acesso à web.
O módulo traz tabela detalhada com função e custo relativo de cada.
Cria um arquivo markdown em .claude/agents/ com frontmatter YAML (name, description, tools, model) seguido do system prompt.
Agentes especializados (migrator, dba, sec-review, doc-writer) que você reusa em vez de reexplicar a cada sessão.
Descrição precisa é crítica: é por ela que o Claude decide se aciona ou não. Seja específico.
O agente principal NÃO enxerga nada do que o subagente leu, pensou ou gerou internamente. Só recebe o texto final — tipicamente 200–600 palavras.
Isso é a feature: contexto isolado = principal limpo. Mas também implica limitação: o pai não pode "perguntar depois" sobre detalhes que o filho viu.
Dê ao subagente instruções claras do formato de saída — você só vê isso.
Tarefa típica de "busca + análise em 20 arquivos": sem delegação adiciona ~40k tokens ao principal. Com delegação: ~1k (só o resumo final).
É a forma mais direta de fugir do custo quadrático. O subagente "gasta" o contexto dele, morre, e o seu fica intacto.
O módulo completo traz a tabela com a conta detalhada.
📚 Dividir Tarefas Grandes em Sessões
Migração de sistema inteiro em uma sessão? Não. 5 sessões focadas? Sim.
Sessão monolítica = atinge context rot cedo, custo cresce quadraticamente, sem checkpoints para voltar, impossível de reverter só um trecho.
Todo problema sério de "o Claude ficou ruim depois de 3 horas" tem a mesma raiz: a tarefa era grande demais para uma sessão só.
Uma tarefa grande não é uma sessão grande. Uma tarefa grande é múltiplas sessões pequenas encadeadas.
Sessão 1: lê tudo, produz resumo. Sessão 2: lê resumo, produz plano. Sessão 3: lê plano, executa. Cada uma com seu handoff de saída.
Esse padrão resolve 80% das tarefas médias sem precisar pensar. É o "arroz com feijão" do curso.
Cada sessão tem UM objetivo claro. Nunca misture.
Caso real: migrar backend Express → Fastify. Sessão 1: mapa. Sessão 2: plano. Sessão 3: rotas. Sessão 4: middlewares. Sessão 5: testes.
Ver a decomposição concreta ensina mais que a teoria. O módulo traz tabela com objetivo e entrega de cada uma.
Cada sessão entrega algo testável e commitável.
Mesmo template da Trilha 3: objetivo, estado atual, decisões, próximos passos. Cada sessão produz o handoff que alimenta a próxima.
Sem handoff, "dividir em sessões" vira "começar do zero 5 vezes". O handoff é a ponte que mantém continuidade sem arrastar contexto.
O handoff é a única coisa que viaja entre sessões. Trate-o como ouro.
Não confie no contexto do Claude para manter estado. Salve plan.md, decisions.md, tests.md no repositório. Cada sessão nova lê o que precisa.
Artefatos em arquivo são cache de trabalho humano + Claude. Dura dias, versionado no git, acessível a qualquer agente futuro.
Memória confiável = arquivo em disco, não histórico de conversa.
Para tarefas com menos de 20 turnos, dividir só adiciona overhead de handoff. Fix simples, refactor pontual, bug isolado — tudo cabe em uma sessão.
Nem tudo precisa ser pipeline. Regra prática: divida se estimar mais de 30 turnos OU múltiplos contextos claramente diferentes.
Divisão é ferramenta, não religião.
📝 Arquivos — Markdown > PDF/HTML/DOCX
PDF custa 1.500–3.000 tokens por página. Markdown custa ~500. Diferença de 5× no mesmo conteúdo.
A Anthropic documenta explicitamente: cada página de PDF custa entre 1.500 e 3.000 tokens. Motivo: cada página é convertida em imagem + texto extraído.
Um PDF de 30 páginas pode tomar 60k–90k tokens só de input. O mesmo conteúdo em markdown: 10k–15k. Diferença brutal.
PDF é pior formato para Claude. Converta sempre que possível.
Mesmo conteúdo (~500 palavras) em cada formato: Markdown ~500 tokens, TXT puro ~480, HTML com Tailwind ~1.200, PDF ~1.500–3.000.
Intuição visual ajuda a escolher sem pensar. HTML inflado, JSON formatado e PDF são os campeões de desperdício.
Markdown é 5–6× mais barato que PDF para o mesmo conteúdo.
Comando CLI: pandoc input.pdf -o output.md. Alternativas: ferramentas online (pandoc.org), ou pedir ao Claude via subagente dedicado com leitura + extração.
Uma linha de comando converte meses de documentos. Paga-se em minutos de contexto economizado.
Pandoc é a faca suíça da conversão. Instale no ambiente de trabalho.
Logs gigantes (use grep antes), binários, arquivos minified, node_modules (NEVER), snapshots de banco, dumps JSON completos. Todos queimam contexto por nada.
Muito erro de "estourei contexto" vem de anexar pasta inteira "pra ele entender melhor". O Claude entende melhor vendo MENOS e mais relevante.
Menos anexo + mais curadoria = mais qualidade e custo menor.
Antes de anexar um arquivo de 2.000 linhas, pergunte: quais 50 linhas realmente importam? Cole só essas. Se não sabe qual, delegue a busca a um subagente.
Esse é o hábito nº1 de quem domina contexto. Curadoria humana custa 10 segundos; economia em tokens vale muito mais.
"Eu não sei o que é relevante" é um bom caso para um Explore agent.
Skills ocupam até 5k tokens SOB DEMANDA (só quando acionadas). Anexar um arquivo de 5k no prompt ocupa TODOS os turnos até o fim.
Transformar "instruções que repito" em skills é economia estrutural: o conteúdo só aparece quando precisa.
Skill para regras recorrentes, CLAUDE.md para regras permanentes, anexo só para dados da tarefa atual.