4.1 ~45 min · Intermediário

🤖 Subagents: delegar tarefas

Aprenda a delegar tarefas complexas a instâncias paralelas do Claude Code, multiplicando sua capacidade sem aumentar o tempo de espera.

Orquestrador Claude Code 🔍 Explore leitura/análise ⚙️ General acesso completo 📚 Pesquisa busca em docs 💻 Coding gera código Resultado agregado 4 subagents em paralelo — resultado 4× mais rápido

🧠 O que é um subagent

Um subagent é uma instância independente do Claude Code lançada pelo agente principal (orquestrador) para executar uma tarefa específica. Ele recebe um prompt bem delimitado, executa com suas próprias ferramentas e retorna um resultado resumido.

O orquestrador usa a ferramenta interna Task para criar subagents. Cada Task é isolada: tem seu próprio histórico de conversa, contexto de arquivos e permissões configuradas.

💡 Conceito central

O subagent não compartilha memória com o orquestrador. Ele só sabe o que está no prompt que recebeu. Isso é uma feature — isolamento garante que um subagent não contamine o contexto de outro.

Ciclo de vida de um subagent

1

Orquestrador formula a tarefa

Define o prompt com escopo claro, formato de saída esperado e permissões necessárias

2

Harness lança a instância

Nova sessão isolada é criada com o prompt como contexto inicial

3

Subagent executa com ferramentas

Usa Bash, Read, WebSearch e outras ferramentas conforme necessário

4

Resultado retorna ao orquestrador

Texto comprimido com o output — não o log completo, apenas a resposta

🎯 Quando delegar a um subagent

✓ Delegar QUANDO

  • Tarefa tem escopo bem definido e resultado atômico
  • Pode rodar em paralelo com outras tarefas
  • Pesquisa ampla (múltiplas fontes, múltiplos arquivos)
  • Tarefa repetida N vezes com inputs diferentes
  • Isolamento de risco (testar código perigoso)

✗ NÃO delegar QUANDO

  • Tarefa requer acesso ao histórico do orquestrador
  • Resultado é trivial (2-3 linhas de código)
  • Subagents precisam comunicar entre si em tempo real
  • Custo de tokens supera o benefício de velocidade
  • Tarefa exige aprovação humana no meio do processo

💡 Dica prática

O critério mais rápido: consegue descrever a tarefa em 1-2 frases com input e output claros? Se sim, é candidata a subagent. Se precisa de parágrafos de contexto, execute no orquestrador mesmo.

⚡ Fan-out: o padrão mais poderoso

Fan-out é quando um orquestrador dispara N subagents simultaneamente, cada um resolvendo uma fatia do problema. O orquestrador fica bloqueado aguardando todos terminarem, depois agrega os resultados.

Uma pesquisa que visitaria 8 fontes em série (8 × 30s = 4 minutos) vira 8 subagents paralelos (~30 segundos). Velocidade 8× com o mesmo custo total.

// Exemplo de prompt para orquestrador com fan-out
Você é o orquestrador. Use a ferramenta Task para criar
4 subagents em PARALELO:

Task 1: Pesquise a doc oficial do Claude Code sobre hooks.
         Retorne: lista de eventos disponíveis com descrição.

Task 2: Leia os arquivos .claude/settings.json do projeto.
         Retorne: estrutura atual de configuração.

Task 3: Pesquise exemplos de hooks em repositórios públicos.
         Retorne: 3 exemplos práticos com código.

Task 4: Analise o código em src/ para identificar
         oportunidades de automação com hooks.
         Retorne: lista priorizada de melhorias.

// Aguarde TODOS terminarem, depois integre os resultados.

📊 Ganho de tempo real

Série (4 tarefas × 3 min) 12 min
Fan-out paralelo (4 agentes) ~3 min
Ganho 4× mais rápido

⚠️ Limite prático

O ganho de velocidade aumenta com N subagents, mas o custo também. Para tarefas de 1-2 minutos, fan-out com 4-8 agentes é o ponto ótimo. Além de 10 agentes, o overhead de coordenação reduz o retorno.

🔬 Tipos de subagent: Explore vs General

🔍 Tipo Explore

Modo de leitura — acesso somente a ferramentas de observação (Read, Bash somente leitura, WebSearch). Não pode criar ou modificar arquivos.

  • Ideal para pesquisa, análise de codebase, busca em docs
  • Mais seguro — sem risco de modificação acidental
  • Mais barato — contexto menor, menos ferramentas

⚙️ Tipo General

Acesso completo às ferramentas — pode ler, escrever, executar comandos e interagir com APIs externas.

  • Ideal para implementação, testes, deploy
  • Requer permissões cuidadosamente configuradas
  • Use quando precisa de ação, não só de análise

🚨 Princípio do menor privilégio

Sempre use o tipo mais restrito que a tarefa permite. Um subagent de pesquisa com permissão de escrita é um risco desnecessário — se o modelo "alucinar" uma instrução, pode modificar arquivos por engano.

💰 Resultado, custo e ROI

Como o resultado retorna

O resultado de um subagent chega ao orquestrador como texto puro — um resumo consolidado do que foi encontrado/feito. O orquestrador não recebe o log de ferramentas, apenas a resposta final.

Para garantir que o resultado seja consumível, especifique no prompt o formato de saída: Retorne: lista de bullets, Retorne: JSON com campos X e Y, etc.

// Estimativa de custo por subagent (Claude Sonnet)
Prompt do orquestrador:   ~500 tokens  ($0.003)
Execução do subagent:     ~2000 tokens ($0.012)
Output para orquestrador: ~300 tokens  ($0.002)
                           ──────────────────────
Total por subagent:        ~$0.017

// Com prompt caching (se CLAUDE.md ou contexto fixo):
Custo cache hit: ~$0.002 (10× mais barato)

// ROI: 1h de trabalho humano = $50-100
// 100 subagents = $1.70 → 30× mais barato que humano

💡 Cálculo rápido de ROI

Compare: tempo economizado × valor do seu tempo vs custo da API. Se você economiza 1h ($50) e a automação custa $0.50, o ROI é 100×. Vale para qualquer tarefa que você faz mais de uma vez por semana.

✅ Boas práticas ao usar subagents

✓ O que FAZER

  • Especificar formato de saída no prompt
  • Usar o tipo mais restrito possível
  • Limitar escopo: uma responsabilidade por subagent
  • Ativar prompt caching para contextos repetidos

✗ O que EVITAR

  • Subagents que dependem uns dos outros em tempo real
  • Passar o histórico inteiro do orquestrador como contexto
  • Subagents com permissão de escrita em banco de produção
  • Mais de 10 subagents paralelos sem estimar custo antes

🎯 Resumo do Módulo 4.1

Subagent — instância isolada do Claude Code com contexto e permissões próprios
Fan-out paralelo — N subagents simultâneos multiplicam velocidade sem custo extra
Explore vs General — sempre use o tipo mais restrito que a tarefa permite
Resultado resumido — especifique o formato de saída para facilitar a agregação
ROI de automação — compare tempo economizado vs custo API antes de implementar

Próximo Módulo:

4.2 — 🪝 Hooks: automatizar o harness com PreToolUse, PostToolUse, SessionStart e Stop