Mapa da trilha
🛡️ Segurança
Princípio do menor acesso
⭐ Northstar (Goals)
Não para até bater a meta
👥 Sub-agentes
Time em paralelo
💓 Heartbeat / Cron
Trabalha enquanto você dorme
💰 Budget & Tokens
73% é overhead fixo
🌐 Operating System
O sistema de tudo
🔗 One Brain
Hermes + Claude Code
Conteúdo detalhado
🛡️ Segurança · Princípio do menor acesso
As regras da casa: dar ao agente só o que ele precisa, e nunca expor segredos no chat.
Diferente de um chatbot, o agente pode mandar email, mexer em arquivos e agir no seu computador. Acesso real exige cuidado real.
Antes de ligar qualquer poder novo, você precisa entender o que pode dar errado.
Não dê as chaves do reino; ligue capacidades aos poucos.
Dê ao agente apenas a permissão que a tarefa exige — nada além. Vale para o Hermes e para qualquer sistema.
Se algo der errado, o estrago fica contido ao mínimo.
Ler ≠ escrever ≠ enviar; comece restritivo, amplie sob demanda.
Habilite "ler email" agora, mas segure "enviar/responder email" até confiar no comportamento.
Um envio errado é irreversível; leitura é segura.
Ações irreversíveis por último; teste em modo leitura primeiro.
O chat é salvo e indexado na memória; um segredo colado ali fica gravado, ainda mais se há backup diário.
Vazar a chave dá acesso ao seu modelo e ao seu dinheiro.
Use variáveis de ambiente; se vazou, rotacione já.
Quando o agente pede acesso, você decide: permitir uma vez, pela sessão, ou bloquear de vez.
Cada nível troca conveniência por controle.
"Once" para o desconhecido; "never" para o perigoso.
Os mesmos princípios protegem você em qualquer agente ou sistema de IA, não só no Hermes.
Hábito de segurança é transferível e te acompanha.
Mínimo acesso + segredos fora do chat = base segura.
⭐ Northstar (Goals) · Não para até bater a meta
Em vez de pergunta→resposta, você dá um norte e o agente trabalha turnos até atingir o objetivo.
Você define uma meta e toda a conversa passa a existir para alcançá-la, não para responder algo isolado.
É como transformar um chat em mini-projeto com propósito.
Objetivo > resposta única; o agente persegue, não só reage.
Ao receber /goal, o Hermes assina um orçamento de cerca de 20 turnos para chegar à decisão.
Saber o limite ajuda a calibrar o tamanho da meta.
Faz perguntas, não fica em loop; converge dentro do orçamento.
Para metas grandes demais, a skill super goals gera de 4 a 10 ações (suas e do agente) com barra de progresso.
Nem toda meta cabe em 20 turnos; super goals quebra em etapas.
Mission control no dashboard; progresso visível.
Comandos para iniciar, pausar e limpar uma meta a qualquer momento.
Você mantém o volante mesmo numa tarefa autônoma.
Pausar guarda estado; limpar zera o objetivo.
Os chief wickham loops são metas que duram semanas, para planejar a vida e não só um projeto curto.
Conecta o curto prazo (turnos) ao longo prazo (vida).
Loop recorrente de revisão; horizonte de semanas.
Goals brilham quando há uma decisão a tomar ou um projeto curto a entregar — não para perguntas avulsas.
Usar goal para tudo desperdiça turnos.
Decidir A vs B é caso de ouro; "que horas são" não é.
👥 Sub-agentes · Time em paralelo
O Hermes sobe vários sub-agentes com contexto fresco e delega — 6 trabalhando juntos fazem em 1h o que levaria 6h.
Em vez de fazer tudo num único fio, o Hermes vira um orquestrador que reparte o trabalho entre auxiliares.
Tarefas grandes ficam viáveis quando viram várias pequenas.
Orquestrador + executores; dividir para conquistar.
Cada sub-agente nasce com janela de contexto própria e limpa, focada só na sua subtarefa.
Contexto enxuto = respostas melhores e mais baratas.
Isolamento evita confusão entre tarefas.
De 4 a 6 agentes pesquisam ao mesmo tempo e entregam juntos no fim, em vez de um depois do outro.
Paralelismo é a jogada de power user que comprime o tempo.
Largura > profundidade quando as tarefas são independentes.
"Pesquise as melhores empresas de IA" sobe 2 sub-agentes: um cobre os EUA, outro o mercado internacional.
Mostra como dividir um escopo amplo por recorte claro.
Divisão por dimensão (região, tema); junção no final.
O co-fundador do Hermes roda 12 instâncias paralelas todo dia para construir o próprio Hermes (issues, dogfooding, kanban).
É a prova de que paralelismo escala muito além de 2 ou 3.
Dogfooding em escala; uma frota de agentes.
Cada agente pode ter um papel: pesquisa, escrita, design, scheduler — como funções num time real.
Papéis claros evitam dois agentes fazendo a mesma coisa.
Especialização; cada papel com seu modelo ideal.
💓 Heartbeat / Cron · Trabalha enquanto você dorme
O batimento que mantém o agente vivo 24/7 e os agendamentos que disparam tarefas sozinhos.
Um cron job que mantém o agente acordado o tempo todo, em vez de só reagir quando você fala.
É o que separa um chatbot de um agente que opera sozinho.
Pulso periódico; presença contínua.
Um sub-agente faz ping a cada poucos segundos para detectar processos "zumbis" (parados) e recuperá-los.
Sem isso, uma tarefa travada ficaria parada para sempre.
Detecção de travamento; fresh agent reclaim; retries.
Você agenda uma ação para rodar num intervalo: "me lembre em 30s que o céu é azul".
Automatiza lembretes e rotinas sem você abrir o app.
Agendamento por tempo; dispara sozinho.
Todo dia às 8h o Hermes varre email + calendário + o que sabe de você e entrega 5 itens que importam.
Mostra como cron + memória viram um assistente proativo.
Agregação de fontes; curadoria diária.
Com heartbeat, o agente faz check-in proativo: "periodicamente me pergunte coisas".
Inverte a relação: ele te procura, não só responde.
Proatividade; iniciativa do agente.
Cada disparo consome tokens; agendamentos demais geram custo e notificações em excesso.
Conecta com o módulo de budget (3.5).
Frequência sob medida; revise os crons ativos.
💰 Budget & Tokens · 73% é overhead fixo
O segredo sujo dos agentes: a maior parte de cada request é custo fixo. Saber disso muda como você opera.
Cerca de 73% de cada request é overhead fixo (system prompt, ferramentas, memória) — só ~27% é a sua pergunta.
Explica por que perguntas curtas ainda custam caro.
Custo base alto; cada chamada paga o "pedágio".
A conta de bolso: ~10 tokens equivalem a cerca de 7 palavras (≈70-75%).
Te dá noção de tamanho antes de mandar texto enorme.
Token ≈ pedaço de palavra; estimar é fácil.
Limpe a sessão com frequência, use o modelo certo, não acumule skills inúteis e mantenha system prompts curtos.
Pequenos hábitos cortam a conta pela metade.
Uma conversa, uma meta; sempre recomeçar limpo.
Alguém queimou 4 milhões de tokens em 2h de uso leve; outro gastou 21.000 só perguntando o tempo por um erro.
Com API key, o dinheiro some rápido se você não vigia.
Loop descontrolado custa caro; monitore o uso.
Seja específico no modelo: raciocínio pesado no caro, volume no barato ou free.
A escolha errada multiplica o custo sem ganho.
Caro só onde vale; barato no resto.
Defina um teto (ex.: US$10/mês) e o sistema para ao atingir o limite.
Teto é a rede de segurança contra surpresas na fatura.
Limite duro; alerta antes de estourar.
🌐 Operating System · O sistema de tudo
O Hermes não é só um chatbot: é um painel único para gerir personas, memória, gastos, metas e conexões.
O Hermes pode ser a camada onde você gere TODA a sua IA num só lugar — o "everything of AI".
Muda a mentalidade de "app de chat" para "sistema operacional".
Um hub, não uma feature solta.
O Pantheon mostra suas personas (cada uma com job e modelo) de forma visual dentro do OS.
Ver as personas num lugar facilita escolher quem usa o quê.
Personas como cards; modelo por persona.
Um cofre de memória que recupera qualquer email, reunião ou nota; dá para conectar o NotebookLM.
Centraliza o conhecimento que o agente pode consultar.
Recall universal; fontes plugáveis.
Num olhar: conexões disponíveis, modelo em uso, memória, gasto de IA, ganhos com skills e uso em tempo real.
Operar sem painel é voar às cegas.
Visão única; métricas ao vivo.
O OS "sonha" melhorias à noite e volta com sugestões proativas no dia seguinte.
O sistema evolui sozinho, sem você pedir.
Auto-otimização; ideias enquanto você dorme.
Conecte o OS ao GitHub para backup diário do Hermes inteiro; perdeu o PC, restaura tudo.
Seu OS é valioso demais para morrer com o hardware.
Snapshot diário; restauração completa.
🔗 One Brain · Hermes + Claude Code
Conectar o cérebro do Hermes ao Claude Code: memória e entendimento compartilhados fecham os 21 conceitos.
A ideia central é ligar a marca/cérebro do Hermes ao Claude Code para que compartilhem contexto.
Dois agentes isolados repetem trabalho e se contradizem.
Uma mente, duas ferramentas; ponte de contexto.
Hermes conhece seus projetos, clientes e decisões e vive em todo lugar; Claude Code é a ferramenta de precisão para construir.
Cada um brilha num papel; saber isso evita usar a ferramenta errada.
Contexto amplo vs precisão; ubíquo vs focado.
Conectados, os dois acessam o que cada um fez; o que você fala num lado chega ao outro.
Memória compartilhada é o que torna a conexão significativa.
Estado comum; sem silos.
Se você diz uma coisa ao Hermes e outra ao Claude Code, sem conexão eles divergem.
Divergência gera retrabalho e decisões inconsistentes.
Silo = contradição; ponte = coerência.
Este é o conceito #21: ele costura tudo o que veio antes numa visão única.
Ver o todo te prepara para operar de verdade.
Do agente ao OS; tudo conectado.
Com os 21 conceitos na mão, o próximo passo é montar o seu próprio operating system de IA.
Teoria sem prática não vira operação.
Comece pequeno; conecte; itere.