🧩 Framework vs cérebro
O Hermes é o framework agêntico (a estrutura que age); o "cérebro" é um modelo plugável. O comando /model troca esse cérebro sem mexer no resto.
Trocar o cérebro (ilustrativo)
/model opus-4.8 ← raciocínio pesado /model gpt ← volume geral /model deepseek ← quase de graça
🧬 Model-agnostic
Como o framework não depende de um modelo específico, você fica livre para usar o melhor cérebro para cada tarefa. Essa separação é o coração da estratégia multi-brain.
🧠 Para raciocínio: Opus com teto
Para raciocínio pesado, use Opus 4.7/4.8 via OpenRouter, com teto de gasto (ex.: US$10/mês e para). Modelo caro só no que vale a pena.
📊 Como controlar o custo
- •Defina um teto mensal (ex.: US$10) — ao bater, para
- •Reserve o Opus para tarefas difíceis, não para tudo
- •Acesse via OpenRouter para comparar custo facilmente
💡 Dica prática
O teto de gasto é a sua rede de segurança. Sem ele, raciocínio pesado pode queimar dinheiro rápido (ver Trilha 3, módulo de budget).
⚡ Para volume: GPT e Grok
Para tarefas gerais de alto volume: use GPT (seu ChatGPT via OAuth aproveita a assinatura de US$20) ou Grok (com o X conectado, ele busca no Twitter).
GPT via OAuth
Conecte o seu ChatGPT e aproveite a assinatura de US$20 que você já paga.
Grok + X
Bom para volume e, com o X conectado, busca direta no Twitter.
💡 Dica prática
Use o que você já assina. Conectar o ChatGPT via OAuth (módulo 1.5) transforma a assinatura existente no "cérebro de volume" do Hermes.
🆓 Quase de graça: DeepSeek e free
DeepSeek e modelos free rodam quase de graça. O dado que importa: o DeepSeek V4 flash entrega ~95% da performance por ~1% do custo.
📊 O número que muda tudo
- ~95% da performance de um modelo de ponta
- ~1% do custo
- Ideal para autopilot e tarefas de fundo de alto volume
✓ Use modelo barato em
- ✓Tarefas de fundo, em volume
- ✓Autopilot e automações repetitivas
- ✓Quando 95% já basta
✗ Evite em
- ✗Raciocínio de alto impacto
- ✗Decisões críticas onde 5% importa
- ✗Tarefas que exigem o melhor cérebro
🔌 OpenRouter: um hub, muitos modelos
O OpenRouter é 1 conexão que dá acesso a centenas de modelos, com rankings de performance e custo para comparar antes de escolher.
🗺️ Por que centralizar
- •Uma chave/conexão para muitos modelos
- •Rankings ajudam a achar o melhor custo-benefício
- •Trocar de modelo (
/model) fica trivial
Onde comparar
# rankings de modelos (performance × custo) openrouter.ai/models
🔨 "Para um martelo, tudo é prego"
Usar um único modelo para tudo é como ter só um martelo: tudo vira prego. A estratégia multi-brain é variar a ferramenta conforme a tarefa.
Raciocínio difícil → Opus
Com teto de gasto, no que realmente importa.
Volume geral → GPT/Grok
Aproveitando assinaturas que você já tem.
Tarefas de fundo → DeepSeek/free
~95% da performance por ~1% do custo.
💡 Dica prática
Pense no Hermes como uma caixa de ferramentas, não um martelo. Trocar de cérebro por tarefa é o que dá o melhor resultado pelo menor custo.
🧯 Erros comuns na escolha do modelo
A maioria dos desperdícios de custo vem de usar o cérebro errado para a tarefa. Veja o que fazer e o que evitar.
✓ Faça
- ✓Modelo caro só em tarefas de alto impacto
- ✓Defina teto de gasto no Opus
- ✓Consulte rankings antes de escolher
✗ Evite
- ✗Usar Opus para tudo (queima dinheiro)
- ✗Ignorar assinaturas que você já paga
- ✗Fixar um único modelo (o "martelo")
Guia de bolso (ilustrativo)
raciocínio difícil -> Opus 4.7/4.8 (teto US$10/mês) volume geral -> GPT (OAuth) / Grok (com X) tarefa de fundo -> DeepSeek V4 flash (~95% perf, ~1% custo) acesso a tudo -> OpenRouter (1 conexão, rankings)
📌 Resumo do Módulo
Próximo Módulo:
1.7 — Local & Privado