Trilha 4 — Técnicas Avançadas | Mestre em Contexto e Tokens

Conteúdo Detalhado

4.1~35 min

🤖 Delegar para Subagentes

Cada subagente tem contexto próprio. O principal fica limpo. Pesquisas verbosas não poluem mais seu trabalho.

O que é:

Um agente invocado pelo agente principal que roda em sua própria janela de contexto, com system prompt customizado, tools específicas e permissões independentes. Começa sempre do zero.

Por que aprender:

Delegar tarefa A ao subagente significa que tudo que ele ler ou gerar NÃO vai poluir o contexto principal. O pai só recebe o resumo final.

Conceitos-chave:

Documentação oficial: "Each subagent runs in its own context window with a custom system prompt, specific tool access, and independent permissions."

O que é:

Qualquer operação verbosa onde só o resumo final importa: pesquisar 20 arquivos, analisar um PDF gigante, varrer logs, fazer síntese de documentos, web research.

Por que aprender:

Se você está prestes a encher a tela de saídas, é forte sinal de que a tarefa devia ser delegada. O principal nunca deveria ser "depósito" de output bruto.

Conceitos-chave:

Regra: se o resultado cabe em 300 palavras, mas o caminho lê 50k tokens — delegue.

O que é:

Explore (busca rápida no repo), general-purpose (tarefas multi-step), web-research-assistant (pesquisa web profunda), Plan (cria plano de execução), code-reviewer (auditoria de diff).

Por que aprender:

Escolher o certo muda eficiência e custo. Explore é barato e rápido; general-purpose é versátil mas caro; research tem acesso à web.

Conceitos-chave:

O módulo traz tabela detalhada com função e custo relativo de cada.

O que é:

Cria um arquivo markdown em .claude/agents/ com frontmatter YAML (name, description, tools, model) seguido do system prompt.

Por que aprender:

Agentes especializados (migrator, dba, sec-review, doc-writer) que você reusa em vez de reexplicar a cada sessão.

Conceitos-chave:

Descrição precisa é crítica: é por ela que o Claude decide se aciona ou não. Seja específico.

O que é:

O agente principal NÃO enxerga nada do que o subagente leu, pensou ou gerou internamente. Só recebe o texto final — tipicamente 200–600 palavras.

Por que aprender:

Isso é a feature: contexto isolado = principal limpo. Mas também implica limitação: o pai não pode "perguntar depois" sobre detalhes que o filho viu.

Conceitos-chave:

Dê ao subagente instruções claras do formato de saída — você só vê isso.

O que é:

Tarefa típica de "busca + análise em 20 arquivos": sem delegação adiciona ~40k tokens ao principal. Com delegação: ~1k (só o resumo final).

Por que aprender:

É a forma mais direta de fugir do custo quadrático. O subagente "gasta" o contexto dele, morre, e o seu fica intacto.

Conceitos-chave:

O módulo completo traz a tabela com a conta detalhada.

Ver Completo

4.2~30 min

📚 Dividir Tarefas Grandes em Sessões

Migração de sistema inteiro em uma sessão? Não. 5 sessões focadas? Sim.

O que é:

Sessão monolítica = atinge context rot cedo, custo cresce quadraticamente, sem checkpoints para voltar, impossível de reverter só um trecho.

Por que aprender:

Todo problema sério de "o Claude ficou ruim depois de 3 horas" tem a mesma raiz: a tarefa era grande demais para uma sessão só.

Conceitos-chave:

Uma tarefa grande não é uma sessão grande. Uma tarefa grande é múltiplas sessões pequenas encadeadas.

O que é:

Sessão 1: lê tudo, produz resumo. Sessão 2: lê resumo, produz plano. Sessão 3: lê plano, executa. Cada uma com seu handoff de saída.

Por que aprender:

Esse padrão resolve 80% das tarefas médias sem precisar pensar. É o "arroz com feijão" do curso.

Conceitos-chave:

Cada sessão tem UM objetivo claro. Nunca misture.

O que é:

Caso real: migrar backend Express → Fastify. Sessão 1: mapa. Sessão 2: plano. Sessão 3: rotas. Sessão 4: middlewares. Sessão 5: testes.

Por que aprender:

Ver a decomposição concreta ensina mais que a teoria. O módulo traz tabela com objetivo e entrega de cada uma.

Conceitos-chave:

Cada sessão entrega algo testável e commitável.

O que é:

Mesmo template da Trilha 3: objetivo, estado atual, decisões, próximos passos. Cada sessão produz o handoff que alimenta a próxima.

Por que aprender:

Sem handoff, "dividir em sessões" vira "começar do zero 5 vezes". O handoff é a ponte que mantém continuidade sem arrastar contexto.

Conceitos-chave:

O handoff é a única coisa que viaja entre sessões. Trate-o como ouro.

O que é:

Não confie no contexto do Claude para manter estado. Salve plan.md, decisions.md, tests.md no repositório. Cada sessão nova lê o que precisa.

Por que aprender:

Artefatos em arquivo são cache de trabalho humano + Claude. Dura dias, versionado no git, acessível a qualquer agente futuro.

Conceitos-chave:

Memória confiável = arquivo em disco, não histórico de conversa.

O que é:

Para tarefas com menos de 20 turnos, dividir só adiciona overhead de handoff. Fix simples, refactor pontual, bug isolado — tudo cabe em uma sessão.

Por que aprender:

Nem tudo precisa ser pipeline. Regra prática: divida se estimar mais de 30 turnos OU múltiplos contextos claramente diferentes.

Conceitos-chave:

Divisão é ferramenta, não religião.

Ver Completo

4.3~25 min

📝 Arquivos — Markdown > PDF/HTML/DOCX

PDF custa 1.500–3.000 tokens por página. Markdown custa ~500. Diferença de 5× no mesmo conteúdo.

O que é:

A Anthropic documenta explicitamente: cada página de PDF custa entre 1.500 e 3.000 tokens. Motivo: cada página é convertida em imagem + texto extraído.

Por que aprender:

Um PDF de 30 páginas pode tomar 60k–90k tokens só de input. O mesmo conteúdo em markdown: 10k–15k. Diferença brutal.

Conceitos-chave:

PDF é pior formato para Claude. Converta sempre que possível.

O que é:

Mesmo conteúdo (~500 palavras) em cada formato: Markdown ~500 tokens, TXT puro ~480, HTML com Tailwind ~1.200, PDF ~1.500–3.000.

Por que aprender:

Intuição visual ajuda a escolher sem pensar. HTML inflado, JSON formatado e PDF são os campeões de desperdício.

Conceitos-chave:

Markdown é 5–6× mais barato que PDF para o mesmo conteúdo.

O que é:

Comando CLI: pandoc input.pdf -o output.md. Alternativas: ferramentas online (pandoc.org), ou pedir ao Claude via subagente dedicado com leitura + extração.

Por que aprender:

Uma linha de comando converte meses de documentos. Paga-se em minutos de contexto economizado.

Conceitos-chave:

Pandoc é a faca suíça da conversão. Instale no ambiente de trabalho.

O que é:

Logs gigantes (use grep antes), binários, arquivos minified, node_modules (NEVER), snapshots de banco, dumps JSON completos. Todos queimam contexto por nada.

Por que aprender:

Muito erro de "estourei contexto" vem de anexar pasta inteira "pra ele entender melhor". O Claude entende melhor vendo MENOS e mais relevante.

Conceitos-chave:

Menos anexo + mais curadoria = mais qualidade e custo menor.

O que é:

Antes de anexar um arquivo de 2.000 linhas, pergunte: quais 50 linhas realmente importam? Cole só essas. Se não sabe qual, delegue a busca a um subagente.

Por que aprender:

Esse é o hábito nº1 de quem domina contexto. Curadoria humana custa 10 segundos; economia em tokens vale muito mais.

Conceitos-chave:

"Eu não sei o que é relevante" é um bom caso para um Explore agent.

O que é:

Skills ocupam até 5k tokens SOB DEMANDA (só quando acionadas). Anexar um arquivo de 5k no prompt ocupa TODOS os turnos até o fim.

Por que aprender:

Transformar "instruções que repito" em skills é economia estrutural: o conteúdo só aparece quando precisa.

Conceitos-chave:

Skill para regras recorrentes, CLAUDE.md para regras permanentes, anexo só para dados da tarefa atual.

Ver Completo

← Voltar: Trilha 3 (Handoff) Próxima Trilha: Exemplos →