Mapa da trilha
🤖 Agente, não Chatbot
Faz, não só fala
🐕 O que é o Hermes
Seu cão, não o contratado
🧠 Um Cérebro, 22 Bocas
Uma mente, todo lugar
🏠 Onde o Hermes Vive
Local, VPS ou na nuvem
🔑 OAuth vs API Key
Botão que volta vs chave
🎛️ Escolhendo o Modelo
Caixa de ferramentas, não martelo
💻 Local & Privado
1000 ft abaixo da terra
Conteúdo detalhado
🤖 Agente, não Chatbot
A diferença que muda tudo: um chatbot te diz como fazer; um agente faz. Você dá a meta, ele tem ferramentas e executa.
Um chatbot te explica COMO reservar um voo; um agente realmente reserva. A diferença é a capacidade de agir no mundo.
É o conceito-base de toda a Trilha 1. Sem isso, você usa o Hermes como mais um chatbot e desperdiça o poder dele.
Fala vs faz; conselho vs execução; resposta vs ação concluída.
Chatbot = amigo esperto que dá dicas. Agente = assistente pessoal que executa a tarefa por você.
A analogia fixa a diferença prática melhor que qualquer definição técnica.
Conselho vs delegação; você no comando, ele na execução.
"Ache o voo mais barato de Dubai a Toronto nas próximas 2 semanas" → ele pesquisa, escolhe e abre o resultado num HTML bonito.
Mostra o ciclo meta → pesquisa → decisão → entrega que define um agente.
Meta única; várias etapas autônomas; resultado pronto pra usar.
O agente tem acesso a ferramentas (Gmail, calendário, busca, navegador) e é por elas que ele age, não só conversa.
Ferramentas são o que transforma texto em ação real — a essência do agente.
Sem ferramentas = chatbot; com ferramentas = agente.
O Hermes é uma IA com ferramentas, acessível de onde você estiver pelo celular.
Disponibilidade móvel é o que faz o agente útil no dia a dia, não só na mesa.
Acesso móvel; um agente sempre à mão.
Para uma dúvida rápida ("o que significa X?") um chatbot basta; o agente brilha quando há uma TAREFA a executar.
Evita usar (e pagar) ferramenta pesada onde uma resposta simples resolve.
Pergunta = chatbot; tarefa com passos = agente.
🐕 O que é o Hermes (e quando usar)
Onde o Hermes se encaixa vs Claude Code, OpenClaw e IDEs. Ele é seu Labrador: mora com você, te conhece e melhora ano a ano.
O Hermes é como seu cão: vive com você, te conhece e fica melhor ano após ano.
Define o "design ethos" do Hermes: persistência e crescimento ao longo do tempo.
Persistência; relação de longo prazo; melhora contínua.
Claude Code é o contratado: excelente para um job específico, mas não mora com você nem te lembra depois.
Saber a diferença evita esperar memória persistente de uma ferramenta de sessão.
Sessão vs persistência; ferramenta de precisão vs companheiro.
OpenClaw é o colega de quarto; o anti-gravity é sua IDE/parceiro de código. Cada um tem um papel diferente.
Mapear o ecossistema te ajuda a escolher a ferramenta certa para cada momento.
Papéis distintos; nenhum substitui o outro.
A essência do Hermes: quanto mais você usa, mais ele aprende sobre você e mais útil fica.
Cria a expectativa certa: o valor cresce com o tempo, não no primeiro dia.
Efeito de acúmulo; valor composto pelo uso.
Use o Hermes quando estiver móvel — café, academia, no celular. Use ferramentas de desktop quando estiver na mesa.
Saber o contexto certo de cada ferramenta maximiza produtividade.
Móvel = Hermes; mesa = desktop tools.
O princípio de design do Hermes é viver com você e melhorar com o tempo — não ser uma ferramenta descartável.
Esse ethos explica decisões como memória local, soul e backups.
Companheiro persistente; evolução; relação.
🧠 Um Cérebro, 22 Bocas
A mesma inteligência acessível por 22+ interfaces. Onde o Hermes roda é o cérebro; os canais são só bocas plugadas nele.
Onde o Hermes roda (seu PC ou uma VPS) é o cérebro. É a MESMA inteligência, não importa por onde você fala com ela.
Entender que o cérebro é único explica por que a memória e o contexto são compartilhados entre canais.
Um cérebro central; interfaces plugáveis.
Telegram, Discord, WhatsApp, Slack, Matrix, navegador, OS próprio — 22+ interfaces para a mesma mente.
Você fala com o agente pelo canal que já usa, sem aprender app novo.
Multicanal; sem app obrigatório.
Imagine uma operadora no meio: recebe chamadas de qualquer canal e roteia tudo para o seu agente.
A analogia explica como mensagens de fontes diferentes chegam ao mesmo cérebro.
Roteamento central; convergência de canais.
Como a inteligência é central, você não fica preso a um único software ou interface.
Reduz lock-in e te dá flexibilidade de canal conforme o contexto.
Sem lock-in; troca de canal livre.
Como há um único cérebro, você pode começar uma conversa no Telegram e continuar no navegador sem perder o fio.
É o benefício prático mais imediato de ter um cérebro central.
Continuidade entre canais; memória unificada.
Além de apps de chat, o Hermes tem seu próprio OS/dashboard como interface — outra boca para o mesmo cérebro.
Antecipa o conceito de Operating System, aprofundado na Trilha 3.
OS como canal; visão unificada.
🏠 Onde o Hermes Vive
Terminal, local ou VPS: as três casas possíveis do Hermes, com os trade-offs de custo, controle e segurança de cada uma.
Terminal é onde você digita comandos; local é seu próprio computador; VPS é o computador de outra empresa que você aluga.
Sem esse vocabulário, o resto do módulo (e da instalação) não faz sentido.
Terminal; local; VPS.
Rodar no seu PC é grátis, fácil e seguro; funciona enquanto o computador estiver ligado. Muita gente usa um MacBook velho 24/7.
É a forma recomendada para começar — zero custo de hospedagem e total controle.
Grátis; precisa estar ligado; máquina dedicada 24/7.
Você instala colando o comando no terminal (Cmd+Space → "terminal" → colar) ou pedindo ao Claude Code para instalar por você.
É o passo prático que tira o Hermes do papel e o coloca rodando.
Comando colado; Claude Code como instalador.
Uma VPS roda no computador de outra empresa (hosting): você aluga, paga mensal e precisa proteger as portas para evitar ataques.
É a opção para ter o Hermes ligado 24/7 sem deixar seu PC pessoal aceso.
Aluguel mensal; uptime; superfície de ataque.
Provedores de VPS costumam pagar por indicação via links de afiliados. Nem toda recomendação é neutra.
Te deixa crítico ao escolher provedor e evita decisões enviesadas.
Links de afiliado; viés comercial.
Como roda na sua máquina, você pode pedir ao Hermes "desligue o gateway" ou "reinicie" — ele controla a própria infra.
Mostra o poder do controle local: o agente administra a si mesmo.
Auto-administração; controle por linguagem natural.
🔑 OAuth vs API Key
As duas formas de conectar um modelo ao Hermes. OAuth é o botão que você pega de volta; a API key é a chave que você guarda e pode rotacionar.
No OAuth, abre o navegador, você faz login e clica "Allow". A conexão fica pronta, sem manusear chaves.
É a forma mais simples e segura de conectar quando o provedor oferece.
Login + Allow; sem chave exposta; revogável.
Uma API key é uma string de caracteres que vive num servidor e dá acesso aos modelos do provedor.
É a forma usada quando não há OAuth (ex.: Claude) e dá acesso amplo.
String secreta; acesso a todos os modelos do provedor.
Você pode rotacionar a API key a qualquer momento; ao rotacionar, a chave antiga nunca mais funciona.
É a sua defesa se uma chave vazar — basta rotacionar.
Rotação; revogação imediata da chave antiga.
Grok e ChatGPT conectam via OAuth; o Claude NÃO oferece OAuth — é só via API key.
Saber quem oferece o quê evita procurar um botão de OAuth que não existe.
OAuth: Grok, ChatGPT; API key: Claude e outros.
Você roda homes setup no terminal, escolhe o provider e então faz OAuth (reauthenticate) ou cola a API key.
É o ponto exato onde os dois métodos se encontram na prática.
homes setup; escolher provider; OAuth ou colar key.
OAuth é o botão que você pode "pegar de volta" a qualquer momento; a API key é uma chave que precisa ser guardada e pode ser rotacionada.
A imagem fixa a diferença de responsabilidade entre os dois métodos.
Revogar vs guardar; conveniência vs controle.
🎛️ Escolhendo o Modelo
O Hermes é um framework agêntico; o cérebro é um modelo trocável. Estratégia multi-brain: o melhor modelo para cada tarefa.
O Hermes é o framework agêntico; o "cérebro" é um modelo plugável. O comando /model troca esse cérebro.
Separar framework de modelo é o que permite a estratégia model-agnostic.
Framework fixo; modelo trocável; /model.
Para raciocínio pesado, use Opus 4.7/4.8 via OpenRouter, com teto de gasto (ex.: US$10/mês e para).
Modelo caro só no que vale a pena, com limite para não estourar a conta.
Opus para raciocínio; teto de gasto.
Para tarefas gerais de alto volume, use GPT (seu ChatGPT via OAuth aproveita a assinatura de US$20) ou Grok (com X conectado, busca no Twitter).
Aproveita assinaturas que você já paga e reduz custo por token.
GPT via OAuth; Grok + X; volume barato.
DeepSeek e modelos free rodam quase de graça. Ex.: DeepSeek V4 flash entrega ~95% da performance por ~1% do custo.
Para autopilot e tarefas de fundo, modelo barato é a escolha óbvia.
~95% da performance, ~1% do custo; free para volume.
OpenRouter é 1 conexão que dá acesso a centenas de modelos, com rankings de performance e custo para comparar.
Centraliza o acesso e facilita trocar de modelo conforme a tarefa.
Hub único; rankings; comparação de custo.
Usar um único modelo para tudo é como ter só um martelo: tudo vira prego. A ideia é variar a ferramenta por tarefa.
É o resumo prático da estratégia multi-brain.
Model-agnostic; ferramenta certa para cada job.
💻 Local & Privado
Rodar o MODELO na sua máquina, não só o Hermes. 100% privado, funciona offline — a 1000 ft abaixo da terra, voando ou no espaço.
Local-hosted aqui significa que não só o Hermes, mas o próprio MODELO de IA roda na sua máquina.
É o que garante privacidade total e funcionamento offline.
Modelo local; sem servidor externo.
Modelos grandes têm bilhões de parâmetros e precisam de datacenter. No local, você é limitado pelo seu hardware.
Define expectativas: privacidade custa performance/velocidade.
Parâmetros vs hardware; menos performance.
Vá em Apple → Sobre Este Mac, mande um screenshot ao Hermes e pergunte "qual o modelo local mais poderoso que eu rodo?".
É o jeito prático de descobrir o que cabe no seu hardware sem chutar.
Specs do hardware; recomendação por screenshot.
Você baixa modelos via Ollama — ex.: Gemma, Qwen 32B/3.6, ou opções Cloud free.
É a ferramenta-padrão para rodar modelos localmente com poucos comandos.
Ollama; Gemma; Qwen.
Como tudo roda local, é 100% privado e funciona offline: a 1000 ft abaixo da terra, voando ou no espaço.
É o grande argumento do local: nada sai da sua máquina.
Privacidade total; offline; sem dependência de rede.
Local vale quando privacidade ou operação offline são inegociáveis; para máxima potência, modelos em nuvem ainda ganham.
Ajuda a decidir entre privacidade e performance conforme o caso.
Decisão por prioridade; privacidade vs potência.