MÓDULO 3.3

👥 Sub-agentes · Time em paralelo

Um agente sozinho é poderoso. Um time de agentes em paralelo é outra liga. O Hermes pode subir vários sub-agentes, cada um com contexto fresco, delegar uma fatia para cada e juntar tudo no fim — fazendo em 1h o que levaria 6h.

Hermes orquestrador research EUA research intl escrita design scheduler Relatório 1h vs 6h

Diagrama ilustrativo · um orquestrador, um time paralelo, um único resultado

6
Tópicos
~30
Minutos
Avançado
Nível
Prática
Tipo
1

🧑‍🤝‍🧑 Hermes como time

Em vez de fazer tudo num único fio de raciocínio, o Hermes pode virar um orquestrador: ele reparte o trabalho entre auxiliares, cada um focado numa subtarefa. É a mesma lógica de um gerente que distribui tarefas para a equipe — em vez de fazer tudo sozinho.

🎼 Orquestrador + executores

O orquestrador não faz o trabalho pesado — ele planeja, distribui e junta. Os sub-agentes fazem a execução. Tarefas grandes ficam viáveis quando viram várias pequenas que rodam ao mesmo tempo.

2

🧠 Contexto fresco por agente

Cada sub-agente nasce com a janela de contexto própria e limpa, dedicada só à sua subtarefa. Isso é importante: lembra da Trilha 2 — quanto mais cheio o contexto, pior o desempenho. Dar a cada agente um contexto enxuto significa respostas melhores e mais baratas.

📊 Por que contexto isolado vence

  • Foco — o agente não se distrai com o histórico de outras tarefas.
  • Custo — contexto menor = menos tokens por chamada.
  • Qualidade — sem ruído, a resposta é mais precisa.
3

⚡ Paralelo, não sequencial

Aqui está a virada de chave. Num fluxo sequencial, o agente faz a tarefa A, depois B, depois C — soma dos tempos. No paralelo, de 4 a 6 agentes trabalham ao mesmo tempo e entregam juntos no fim. Em vez de 6 horas em fila, 1 hora simultânea.

✗ Sequencial (lento)

  • Tarefa A (1h) → B (1h) → C (1h)…
  • Tempo total = soma de todas.
  • 6 tarefas ≈ 6 horas.

✓ Paralelo (rápido)

  • A, B, C… todas ao mesmo tempo.
  • Tempo total ≈ a tarefa mais longa.
  • 6 tarefas ≈ 1 hora.

💡 Dica prática

Paralelismo só funciona quando as tarefas são independentes. Se o passo C depende do resultado de B, não dá para rodar junto — aí o sequencial é inevitável.

4

🌎 Exemplo: pesquisa de empregos

O exemplo clássico do material: "pesquise as melhores empresas de IA para trabalhar". O Hermes sobe 2 sub-agentes — um cobre os EUA, outro o mercado internacional. Cada um pesquisa em paralelo e, no fim, ambos entregam para o orquestrador montar o relatório.

Como o pedido vira um time (ilustrativo)

# você
pesquise as melhores empresas de IA para trabalhar
# Hermes orquestra
sub-agente 1: foco EUA
sub-agente 2: foco internacional
# ambos retornam → relatório unificado
5

🏭 12 instâncias paralelas: o caso do co-fundador

Paralelismo não para em 2 ou 3. O co-fundador do Hermes roda 12 instâncias paralelas todo dia para construir o próprio Hermes — monitorando issues, fazendo dogfooding e tocando o kanban. É uma frota de agentes trabalhando como um time inteiro de engenharia.

1

Monitorar issues

Agentes acompanham bugs e pedidos reportados, triando o que chega.

2

Dogfooding

Usar o próprio produto para achar problemas antes dos usuários.

3

Tocar o kanban

Mover tarefas, atualizar status e manter o fluxo de trabalho rodando.

📊 O número que importa

12 instâncias rodando em paralelo, todo dia. Paralelização não é truque de demo — é como power users operam de verdade.

6

🎭 Papéis dos sub-agentes

Como num time real, cada agente pode ter um papel: pesquisa, escrita, design, scheduler. Papéis claros evitam dois agentes fazendo a mesma coisa — e cada papel pode usar o modelo ideal (raciocínio caro só onde vale; volume no barato).

🔎 Research

Coleta e cruza dados.

✍️ Escrita

Redige o entregável.

🎨 Design

Formata e apresenta.

⏰ Scheduler

Coordena prazos.

7

⚖️ Quando paralelizar (e quando não)

Subir um time custa overhead: cada sub-agente repaga os ~73% fixos do request (módulo 3.5). Para uma tarefa pequena, o orquestrador + 5 agentes pode custar mais do que vale. Paralelize quando o ganho de tempo justifica o custo extra.

✓ Vale paralelizar

  • Tarefas independentes e demoradas (pesquisa ampla).
  • Recortes claros (região, tema, fonte).
  • Quando 6h em fila viram ~1h simultânea.

✗ Não vale

  • Tarefa pequena que um agente resolve rápido.
  • Passos dependentes (C precisa do resultado de B).
  • Quando o overhead de 6 agentes supera o ganho.

💡 Dica prática

Antes de subir um time, pergunte: "essas tarefas podem rodar ao mesmo tempo e o tempo economizado paga o overhead?" Se sim, paralelize; se não, mantenha um agente só.

📌 Resumo do Módulo

Hermes como time - orquestrador que planeja, distribui e junta.
Contexto fresco - cada sub-agente começa limpo e focado.
Paralelo > sequencial - 6h de trabalho viram ~1h quando as tarefas são independentes.
Escala real - 12 instâncias paralelas todo dia no caso do co-fundador.
Papéis - research, escrita, design, scheduler — cada um com seu modelo.

Próximo Módulo:

3.4 - 💓 Heartbeat / Cron: o batimento que mantém o agente vivo e trabalhando 24/7.