Módulo 3.3 · Sub-agentes

🧑‍🤝‍🧑 Hermes como time

Em vez de fazer tudo num único fio de raciocínio, o Hermes pode virar um orquestrador: ele reparte o trabalho entre auxiliares, cada um focado numa subtarefa. É a mesma lógica de um gerente que distribui tarefas para a equipe — em vez de fazer tudo sozinho.

🎼 Orquestrador + executores

O orquestrador não faz o trabalho pesado — ele planeja, distribui e junta. Os sub-agentes fazem a execução. Tarefas grandes ficam viáveis quando viram várias pequenas que rodam ao mesmo tempo.

🧠 Contexto fresco por agente

Cada sub-agente nasce com a janela de contexto própria e limpa, dedicada só à sua subtarefa. Isso é importante: lembra da Trilha 2 — quanto mais cheio o contexto, pior o desempenho. Dar a cada agente um contexto enxuto significa respostas melhores e mais baratas.

📊 Por que contexto isolado vence

Foco — o agente não se distrai com o histórico de outras tarefas.
Custo — contexto menor = menos tokens por chamada.
Qualidade — sem ruído, a resposta é mais precisa.

⚡ Paralelo, não sequencial

Aqui está a virada de chave. Num fluxo sequencial, o agente faz a tarefa A, depois B, depois C — soma dos tempos. No paralelo, de 4 a 6 agentes trabalham ao mesmo tempo e entregam juntos no fim. Em vez de 6 horas em fila, 1 hora simultânea.

✗ Sequencial (lento)

✗Tarefa A (1h) → B (1h) → C (1h)…
✗Tempo total = soma de todas.
✗6 tarefas ≈ 6 horas.

✓ Paralelo (rápido)

✓A, B, C… todas ao mesmo tempo.
✓Tempo total ≈ a tarefa mais longa.
✓6 tarefas ≈ 1 hora.

💡 Dica prática

Paralelismo só funciona quando as tarefas são independentes. Se o passo C depende do resultado de B, não dá para rodar junto — aí o sequencial é inevitável.

🌎 Exemplo: pesquisa de empregos

O exemplo clássico do material: "pesquise as melhores empresas de IA para trabalhar". O Hermes sobe 2 sub-agentes — um cobre os EUA, outro o mercado internacional. Cada um pesquisa em paralelo e, no fim, ambos entregam para o orquestrador montar o relatório.

Como o pedido vira um time (ilustrativo)

# você

pesquise as melhores empresas de IA para trabalhar

# Hermes orquestra

→ sub-agente 1: foco EUA

→ sub-agente 2: foco internacional

# ambos retornam → relatório unificado

🏭 12 instâncias paralelas: o caso do co-fundador

Paralelismo não para em 2 ou 3. O co-fundador do Hermes roda 12 instâncias paralelas todo dia para construir o próprio Hermes — monitorando issues, fazendo dogfooding e tocando o kanban. É uma frota de agentes trabalhando como um time inteiro de engenharia.

Monitorar issues

Agentes acompanham bugs e pedidos reportados, triando o que chega.

Dogfooding

Usar o próprio produto para achar problemas antes dos usuários.

Tocar o kanban

Mover tarefas, atualizar status e manter o fluxo de trabalho rodando.

📊 O número que importa

12 instâncias rodando em paralelo, todo dia. Paralelização não é truque de demo — é como power users operam de verdade.

🎭 Papéis dos sub-agentes

Como num time real, cada agente pode ter um papel: pesquisa, escrita, design, scheduler. Papéis claros evitam dois agentes fazendo a mesma coisa — e cada papel pode usar o modelo ideal (raciocínio caro só onde vale; volume no barato).

🔎 Research

Coleta e cruza dados.

✍️ Escrita

Redige o entregável.

🎨 Design

Formata e apresenta.

⏰ Scheduler

Coordena prazos.

⚖️ Quando paralelizar (e quando não)

Subir um time custa overhead: cada sub-agente repaga os ~73% fixos do request (módulo 3.5). Para uma tarefa pequena, o orquestrador + 5 agentes pode custar mais do que vale. Paralelize quando o ganho de tempo justifica o custo extra.

✓ Vale paralelizar

✓Tarefas independentes e demoradas (pesquisa ampla).
✓Recortes claros (região, tema, fonte).
✓Quando 6h em fila viram ~1h simultânea.

✗ Não vale

✗Tarefa pequena que um agente resolve rápido.
✗Passos dependentes (C precisa do resultado de B).
✗Quando o overhead de 6 agentes supera o ganho.

💡 Dica prática

Antes de subir um time, pergunte: "essas tarefas podem rodar ao mesmo tempo e o tempo economizado paga o overhead?" Se sim, paralelize; se não, mantenha um agente só.

📌 Resumo do Módulo

✓

Hermes como time - orquestrador que planeja, distribui e junta.

✓

Contexto fresco - cada sub-agente começa limpo e focado.

✓

Paralelo > sequencial - 6h de trabalho viram ~1h quando as tarefas são independentes.

✓

Escala real - 12 instâncias paralelas todo dia no caso do co-fundador.

✓

Papéis - research, escrita, design, scheduler — cada um com seu modelo.

Próximo Módulo:

3.4 - 💓 Heartbeat / Cron: o batimento que mantém o agente vivo e trabalhando 24/7.

← Módulo anterior Próximo Módulo →