🧑🤝🧑 Hermes como time
Em vez de fazer tudo num único fio de raciocínio, o Hermes pode virar um orquestrador: ele reparte o trabalho entre auxiliares, cada um focado numa subtarefa. É a mesma lógica de um gerente que distribui tarefas para a equipe — em vez de fazer tudo sozinho.
🎼 Orquestrador + executores
O orquestrador não faz o trabalho pesado — ele planeja, distribui e junta. Os sub-agentes fazem a execução. Tarefas grandes ficam viáveis quando viram várias pequenas que rodam ao mesmo tempo.
🧠 Contexto fresco por agente
Cada sub-agente nasce com a janela de contexto própria e limpa, dedicada só à sua subtarefa. Isso é importante: lembra da Trilha 2 — quanto mais cheio o contexto, pior o desempenho. Dar a cada agente um contexto enxuto significa respostas melhores e mais baratas.
📊 Por que contexto isolado vence
- Foco — o agente não se distrai com o histórico de outras tarefas.
- Custo — contexto menor = menos tokens por chamada.
- Qualidade — sem ruído, a resposta é mais precisa.
⚡ Paralelo, não sequencial
Aqui está a virada de chave. Num fluxo sequencial, o agente faz a tarefa A, depois B, depois C — soma dos tempos. No paralelo, de 4 a 6 agentes trabalham ao mesmo tempo e entregam juntos no fim. Em vez de 6 horas em fila, 1 hora simultânea.
✗ Sequencial (lento)
- ✗Tarefa A (1h) → B (1h) → C (1h)…
- ✗Tempo total = soma de todas.
- ✗6 tarefas ≈ 6 horas.
✓ Paralelo (rápido)
- ✓A, B, C… todas ao mesmo tempo.
- ✓Tempo total ≈ a tarefa mais longa.
- ✓6 tarefas ≈ 1 hora.
💡 Dica prática
Paralelismo só funciona quando as tarefas são independentes. Se o passo C depende do resultado de B, não dá para rodar junto — aí o sequencial é inevitável.
🌎 Exemplo: pesquisa de empregos
O exemplo clássico do material: "pesquise as melhores empresas de IA para trabalhar". O Hermes sobe 2 sub-agentes — um cobre os EUA, outro o mercado internacional. Cada um pesquisa em paralelo e, no fim, ambos entregam para o orquestrador montar o relatório.
Como o pedido vira um time (ilustrativo)
🏭 12 instâncias paralelas: o caso do co-fundador
Paralelismo não para em 2 ou 3. O co-fundador do Hermes roda 12 instâncias paralelas todo dia para construir o próprio Hermes — monitorando issues, fazendo dogfooding e tocando o kanban. É uma frota de agentes trabalhando como um time inteiro de engenharia.
Monitorar issues
Agentes acompanham bugs e pedidos reportados, triando o que chega.
Dogfooding
Usar o próprio produto para achar problemas antes dos usuários.
Tocar o kanban
Mover tarefas, atualizar status e manter o fluxo de trabalho rodando.
📊 O número que importa
12 instâncias rodando em paralelo, todo dia. Paralelização não é truque de demo — é como power users operam de verdade.
🎭 Papéis dos sub-agentes
Como num time real, cada agente pode ter um papel: pesquisa, escrita, design, scheduler. Papéis claros evitam dois agentes fazendo a mesma coisa — e cada papel pode usar o modelo ideal (raciocínio caro só onde vale; volume no barato).
Coleta e cruza dados.
Redige o entregável.
Formata e apresenta.
Coordena prazos.
⚖️ Quando paralelizar (e quando não)
Subir um time custa overhead: cada sub-agente repaga os ~73% fixos do request (módulo 3.5). Para uma tarefa pequena, o orquestrador + 5 agentes pode custar mais do que vale. Paralelize quando o ganho de tempo justifica o custo extra.
✓ Vale paralelizar
- ✓Tarefas independentes e demoradas (pesquisa ampla).
- ✓Recortes claros (região, tema, fonte).
- ✓Quando 6h em fila viram ~1h simultânea.
✗ Não vale
- ✗Tarefa pequena que um agente resolve rápido.
- ✗Passos dependentes (C precisa do resultado de B).
- ✗Quando o overhead de 6 agentes supera o ganho.
💡 Dica prática
Antes de subir um time, pergunte: "essas tarefas podem rodar ao mesmo tempo e o tempo economizado paga o overhead?" Se sim, paralelize; se não, mantenha um agente só.
📌 Resumo do Módulo
Próximo Módulo:
3.4 - 💓 Heartbeat / Cron: o batimento que mantém o agente vivo e trabalhando 24/7.