Trilha 3 — Avançado

3.1~35 min

🔧 Tool Use no 4.7

Por que o 4.7 chama menos tools, como forçar busca agressiva e calibrar Read/Grep/Glob.

O que é:

O 4.7 prefere raciocinar com o contexto que já tem em vez de disparar Read/Grep. Dispara menos tools que o 4.6.

Por que aprender:

Menos tool calls = menos latência e mais coerência. Mas pode "parecer preguiçoso" em código legado.

Conceitos-chave:

Se precisa de varredura ampla, peça explicitamente — não espere que aconteça.

O que é:

Effort mais alto aumenta tolerância a tool calls exploratórias. Low reduz drasticamente.

Por que aprender:

Calibrar effort é uma das duas alavancas principais para regular tool use.

Conceitos-chave:

Para busca ampla: xhigh. Para diff cirúrgico com arquivos conhecidos: low.

O que é:

Prompt instruindo o modelo a preferir evidência do código a especulação.

Por que aprender:

Codebase legado desconhecido exige leitura prévia — não confie em memória.

Conceitos-chave:

"Use Read/Grep liberally. Never guess — verify."

O que é:

Snippet que instrui preferência por ferramentas de leitura antes de concluir.

Por que aprender:

Evita alucinação de APIs e reduz retrabalho por baseline errada.

Conceitos-chave:

Bloco <investigate_before_answering> como padrão.

O que é:

Trio de leitura: Glob acha por nome, Grep acha por conteúdo, Read abre o arquivo.

Por que aprender:

Saber qual pedir evita varredura ineficiente (ex: `find | xargs grep`).

Conceitos-chave:

Glob para estrutura, Grep para conteúdo, Read para detalhe.

O que é:

Prompts 4.6 com "CRITICAL: use tool X" ainda disparam busca excessiva no 4.7.

Por que aprender:

Evita custos invisíveis herdados de bibliotecas antigas.

Conceitos-chave:

Remover "MUST use" antes de medir volume de tool calls.

O que é:

Mesmo briefing com e sem prompt de tool use proativo — contar tool calls.

Por que aprender:

Dados próprios calibram suas escolhas melhor que qualquer benchmark genérico.

Conceitos-chave:

Registrar: Read/Grep/Glob count + tokens + tempo humano.

Ver Completo

3.2~40 min

⚡ Fan-out Paralelo

Prompt canônico <use_parallel_tool_calls>, dependências, micro-receitas e medição de wall-clock.

O que é:

Qualquer ação que não depende do output de outra deve rodar em paralelo no mesmo turno.

Por que aprender:

Reduz wall-clock 3–5x em fases exploratórias.

Conceitos-chave:

Independência de dados é o teste — se o output de A não alimenta B, rodar junto.

O que é:

Bloco <use_parallel_tool_calls> instruindo o modelo a maximizar concorrência.

Por que aprender:

Pronto para system prompt ou mensagem inicial.

Conceitos-chave:

"Make multiple independent calls in the same batch."

O que é:

Se B precisa do resultado de A, não é paralelizável. Forçar paralelismo quebra.

Por que aprender:

Erro clássico: ler arquivo depois aplicar Edit — ambos no mesmo turno quebra.

Conceitos-chave:

Cadeia ler→escrever/editar é sempre sequencial.

O que é:

A/B pessoal: contar turnos e segundos em cada execução.

Por que aprender:

Torna visível o ganho wall-clock da paralelização.

Conceitos-chave:

Mesmo tempo de modelo, menos tempo humano.

O que é:

"Never use placeholders or guess missing parameters" — parte do prompt canônico.

Por que aprender:

Paralelismo incentiva pular coleta de dados — isso vira bug.

Conceitos-chave:

Se não tem param, o modelo deve perguntar ou ler.

O que é:

5 patterns: git status+diff+log, Read×N arquivos, Grep×N padrões, build+test+lint, Glob+Grep.

Por que aprender:

Automatiza decisão — já sabe que essas combinam bem.

Conceitos-chave:

Bibliotecas de "sempre paralelos" aceleram cada sessão.

O que é:

Tempo total da tarefa, não tempo do modelo. Só você vê isso.

Por que aprender:

Métrica de produtividade real — tokens não capturam isso.

Conceitos-chave:

Minutos humanos recuperados é o KPI final.

Ver Completo

3.3~45 min

👥 Subagentes Explícitos

Teste mental de delegação, prompt canônico de controle, fan-out múltiplo, economia de contexto.

O que é:

"Preciso do output intermediário ou só da conclusão?" — se só conclusão, subagente.

Por que aprender:

Decisão binária substitui debate sobre "vale a pena".

Conceitos-chave:

Subagente = economia de contexto, não paralelismo automático.

O que é:

"Do not spawn a subagent unless the work is genuinely parallelizable…"

Por que aprender:

Evita over-use em tarefas que cabem em resposta direta.

Conceitos-chave:

Defaults do 4.7 já são conservadores, mas prompt ancora.

O que é:

Disparar 3 subagentes simultâneos quando cada um é independente.

Por que aprender:

Reduz tempo humano de supervisão a zero até os 3 voltarem.

Conceitos-chave:

Paralelismo real — cada subagente tem seu próprio contexto.

O que é:

Tarefa de 2 minutos virando subagente de 10 minutos — overhead puro.

Por que aprender:

Subagente tem custo fixo de setup de contexto.

Conceitos-chave:

Heurística: se resposta cabe em 1 turno, não delega.

O que é:

Subagente lê 50k tokens e retorna resumo de 2k — a janela pai fica limpa.

Por que aprender:

Preserva context window do pai para decisões de alto nível.

Conceitos-chave:

Descobrir, investigar, verificar — todos ótimos para subagente.

O que é:

Subagente começa do zero — tem que receber escopo, constraints, critério.

Por que aprender:

Subagente ruim = briefing incompleto. Igual ICCA de humano.

Conceitos-chave:

Incluir caminhos exatos, não só "procure em algum lugar".

O que é:

Exercício: refator dividido em 3 módulos, 3 subagentes simultâneos.

Por que aprender:

Solidifica mental model através de prática imediata.

Conceitos-chave:

Medir antes/depois: turnos humanos e tempo total.

Ver Completo

3.4~45 min

🍳 Receitas de Subagentes

6 receitas prontas: pesquisa legada, verificação, docs, testes pesados, design, security.

O que é:

Subagente varre código antigo e retorna mapa + entrypoints + riscos.

Por que aprender:

Evita ler 50+ arquivos no contexto principal.

Conceitos-chave:

Output: bulletpoints + caminhos absolutos + snippets curtos.

O que é:

Subagente lê spec + código e lista gaps de implementação.

Por que aprender:

Separação de papéis evita self-review enviesado.

Conceitos-chave:

Coverage > ranking — lista tudo, filtra depois.

O que é:

Subagente lê git diff e gera entry de CHANGELOG + rationale.

Por que aprender:

Libera a janela principal para continuar desenvolvendo.

Conceitos-chave:

Focar no "why" da mudança, não no "what".

O que é:

Subagente roda `pytest -v` e resume falhas em tabela estruturada.

Por que aprender:

Output de testes é ruidoso — 50k tokens de stdout atrapalham.

Conceitos-chave:

Retornar: nome do teste + linha + tipo de erro.

O que é:

3 subagentes exploram 3 abordagens diferentes em paralelo; pai compara.

Por que aprender:

Substitui brainstorm sequencial por diversidade real.

Conceitos-chave:

Dar constraints diferentes a cada — evita resultados idênticos.

O que é:

Subagente com system prompt "você é security auditor" + diff recente.

Por que aprender:

Separar o papel evita viés pró-autor no mesmo contexto.

Conceitos-chave:

Report every finding + severity + confidence.

O que é:

Guardar receitas no editor (VSCode snippets / clipboard manager).

Por que aprender:

Transforma conhecimento em automação pessoal.

Conceitos-chave:

Nomear por caso de uso, não por tecnologia.

Ver Completo

3.5~40 min

🤖 Auto Mode (Claude Code Max)

Shift+Tab, critérios de uso, notificações, interrupção, métricas e caso real de 2h autônomas.

O que é:

No Claude Code Max, Shift+Tab alterna entre manual approval e auto mode.

Por que aprender:

Toggle reversível — você pode voltar ao modo manual quando quiser.

Conceitos-chave:

Plano Max obrigatório — Pro não tem.

O que é:

Tarefa bem escopada, repositório pessoal, critério de sucesso testável.

Por que aprender:

Escolher contextos certos evita descobrir problemas tarde demais.

Conceitos-chave:

Testes automatizados = guard-rail que habilita auto mode.

O que é:

Produção, decisões de design abertas, ambientes compartilhados com CI/CD.

Por que aprender:

Blast radius pode afetar outros humanos — exige aprovação.

Conceitos-chave:

Nunca em branch main compartilhado.

O que é:

Hook `onStop` em settings.json toca som quando o modelo termina/pausa.

Por que aprender:

Libera sua atenção — você volta ao terminal só quando precisa.

Conceitos-chave:

`afplay`/`paplay`/`say` no hook.

O que é:

Esc pausa; você injeta correção; Continue retoma.

Por que aprender:

Saber que pode parar reduz ansiedade de delegar horas.

Conceitos-chave:

Contexto preservado — não precisa recomeçar do zero.

O que é:

Antes: 2h babysitting. Depois: 10 min prompt + 2h autônomo.

Por que aprender:

Número tangível de horas/semana recuperadas justifica Max.

Conceitos-chave:

Meta: 60% do tempo sem você no terminal.

O que é:

Briefing ICCA + tests.json + auto mode — 2h sem supervisão, 1 PR pronto.

Por que aprender:

Mostra o padrão completo em um único caso real.

Conceitos-chave:

Testes verdes são sinal de término para o modelo.

Ver Completo

3.6~35 min

🛡️ Prompts de Segurança

Ações reversíveis vs. irreversíveis, bloco safety canônico, blast radius e checklists.

O que é:

`git commit` é reversível. `git push --force` é quase irreversível. `rm -rf` é.

Por que aprender:

Única classificação que importa para decidir "pedir permissão".

Conceitos-chave:

Irreversível → sempre confirmação humana explícita.

O que é:

rm -rf, force push, drop table, envio de email/PR/deploy, `curl | sh`.

Por que aprender:

Lista explícita dentro do prompt vira guard-rail.

Conceitos-chave:

Adapte à sua stack — não copie cegamente.

O que é:

"Consider the reversibility of any action before executing…" — incluir completo.

Por que aprender:

Copy/paste ancora comportamento em todas as sessões.

Conceitos-chave:

Vira system prompt padrão de projetos sensíveis.

O que é:

Pular pre-commit hook para contornar teste que falha.

Por que aprender:

Hook existe para algo — pular gera bugs em main.

Conceitos-chave:

Proibir explicitamente no prompt. "Never use --no-verify."

O que é:

Arquivo .bak ou .tmp pode ser backup crítico do humano.

Por que aprender:

Deletar por hábito é o erro mais comum de auto mode.

Conceitos-chave:

Mover para `.trash/` e perguntar. Nunca `rm`.

O que é:

Ações que outros humanos ou serviços verão: PR aberto, email, deploy.

Por que aprender:

Blast radius sai do seu repo — sempre confirmação humana.

Conceitos-chave:

"External side effect" = freio de mão obrigatório.

O que é:

4 perguntas antes de ação sensível: reversível? quem vê? guard-rail existe? aprovado?

Por que aprender:

Micro-ritual transforma safety em hábito.

Conceitos-chave:

Cole como comentário no início de prompts de auto mode.

Ver Completo

3.7~55 min

🌉 Longo Horizonte e Multi-Context

Scaffold (init.sh, tests.json, progress.txt, spec.md), context awareness prompt e git como state tracker.

O que é:

`init.sh`, `tests.json`, `progress.txt`, `spec.md` — o estado mínimo para atravessar janelas.

Por que aprender:

Em vez de carregar contexto na memória do modelo, carregar do disco.

Conceitos-chave:

Disco > contexto para tarefas de horas/dias.

O que é:

Bash que cria estrutura inicial + gitignore + primeiros arquivos de estado.

Por que aprender:

Rodar uma vez, ter o repo pronto para auto mode de horas.

Conceitos-chave:

Idempotente — rodar 2x não quebra.

O que é:

JSON com lista de testes e seu status (todo/passed/failed).

Por que aprender:

Estrutura > texto livre. Fácil de patching por todo mundo.

Conceitos-chave:

Começa como arquivo, termina como métrica de progresso.

O que é:

"Your context window will be automatically compacted…" — avisa o modelo.

Por que aprender:

Saber que vai haver compact muda como o modelo escolhe persistir estado.

Conceitos-chave:

Prompt instrui: "salve progresso em arquivo antes de chegar a 150k tokens".

O que é:

Janela 1: monta scaffold e spec. Seguintes: iteram sobre tests.json.

Por que aprender:

Separação clara permite /clear total entre janelas.

Conceitos-chave:

Spec.md é o briefing permanente, readfile é o contexto.

O que é:

Cada tentativa de tarefa longa = branch. Commits marcam checkpoints.

Por que aprender:

Rewind com `git checkout` é mais seguro que rewind de sessão.

Conceitos-chave:

Branch nomeada: `attempt/YYYYMMDD-shortdesc`.

O que é:

Tarefa que obrigatoriamente passa de 200k tokens — força uso de scaffold.

Por que aprender:

Única forma de solidificar: sentir a compactação e ver o retomar.

Conceitos-chave:

Saída com métricas: janelas usadas, compacts, commits, tempo humano.

Ver Completo