MÓDULO 1.6

🎛️ Escolhendo o Modelo

O Hermes é um framework agêntico; o "cérebro" é um modelo trocável com /model. A estratégia multi-brain: o melhor modelo para cada tarefa. Para um martelo, tudo é prego — então varie a ferramenta.

🔌 OpenRouter 1 conexão Opus 4.7/4.8 GPT Grok DeepSeek / free → raciocínio → volume (OAuth) → volume + X/Twitter → quase de graça
6
Tópicos
22
Minutos
Básico
Nível
Prático
Tipo
1

🧩 Framework vs cérebro

O Hermes é o framework agêntico (a estrutura que age); o "cérebro" é um modelo plugável. O comando /model troca esse cérebro sem mexer no resto.

Trocar o cérebro (ilustrativo)

/model opus-4.8      ← raciocínio pesado
/model gpt           ← volume geral
/model deepseek      ← quase de graça

🧬 Model-agnostic

Como o framework não depende de um modelo específico, você fica livre para usar o melhor cérebro para cada tarefa. Essa separação é o coração da estratégia multi-brain.

2

🧠 Para raciocínio: Opus com teto

Para raciocínio pesado, use Opus 4.7/4.8 via OpenRouter, com teto de gasto (ex.: US$10/mês e para). Modelo caro só no que vale a pena.

📊 Como controlar o custo

  • Defina um teto mensal (ex.: US$10) — ao bater, para
  • Reserve o Opus para tarefas difíceis, não para tudo
  • Acesse via OpenRouter para comparar custo facilmente

💡 Dica prática

O teto de gasto é a sua rede de segurança. Sem ele, raciocínio pesado pode queimar dinheiro rápido (ver Trilha 3, módulo de budget).

3

⚡ Para volume: GPT e Grok

Para tarefas gerais de alto volume: use GPT (seu ChatGPT via OAuth aproveita a assinatura de US$20) ou Grok (com o X conectado, ele busca no Twitter).

1

GPT via OAuth

Conecte o seu ChatGPT e aproveite a assinatura de US$20 que você já paga.

2

Grok + X

Bom para volume e, com o X conectado, busca direta no Twitter.

💡 Dica prática

Use o que você já assina. Conectar o ChatGPT via OAuth (módulo 1.5) transforma a assinatura existente no "cérebro de volume" do Hermes.

4

🆓 Quase de graça: DeepSeek e free

DeepSeek e modelos free rodam quase de graça. O dado que importa: o DeepSeek V4 flash entrega ~95% da performance por ~1% do custo.

📊 O número que muda tudo

  • ~95% da performance de um modelo de ponta
  • ~1% do custo
  • Ideal para autopilot e tarefas de fundo de alto volume

✓ Use modelo barato em

  • Tarefas de fundo, em volume
  • Autopilot e automações repetitivas
  • Quando 95% já basta

✗ Evite em

  • Raciocínio de alto impacto
  • Decisões críticas onde 5% importa
  • Tarefas que exigem o melhor cérebro
5

🔌 OpenRouter: um hub, muitos modelos

O OpenRouter é 1 conexão que dá acesso a centenas de modelos, com rankings de performance e custo para comparar antes de escolher.

🗺️ Por que centralizar

  • Uma chave/conexão para muitos modelos
  • Rankings ajudam a achar o melhor custo-benefício
  • Trocar de modelo (/model) fica trivial

Onde comparar

# rankings de modelos (performance × custo)
openrouter.ai/models
6

🔨 "Para um martelo, tudo é prego"

Usar um único modelo para tudo é como ter só um martelo: tudo vira prego. A estratégia multi-brain é variar a ferramenta conforme a tarefa.

🧠

Raciocínio difícil → Opus

Com teto de gasto, no que realmente importa.

Volume geral → GPT/Grok

Aproveitando assinaturas que você já tem.

🆓

Tarefas de fundo → DeepSeek/free

~95% da performance por ~1% do custo.

💡 Dica prática

Pense no Hermes como uma caixa de ferramentas, não um martelo. Trocar de cérebro por tarefa é o que dá o melhor resultado pelo menor custo.

7

🧯 Erros comuns na escolha do modelo

A maioria dos desperdícios de custo vem de usar o cérebro errado para a tarefa. Veja o que fazer e o que evitar.

✓ Faça

  • Modelo caro só em tarefas de alto impacto
  • Defina teto de gasto no Opus
  • Consulte rankings antes de escolher

✗ Evite

  • Usar Opus para tudo (queima dinheiro)
  • Ignorar assinaturas que você já paga
  • Fixar um único modelo (o "martelo")

Guia de bolso (ilustrativo)

raciocínio difícil  -> Opus 4.7/4.8  (teto US$10/mês)
volume geral        -> GPT (OAuth) / Grok (com X)
tarefa de fundo     -> DeepSeek V4 flash (~95% perf, ~1% custo)
acesso a tudo       -> OpenRouter (1 conexão, rankings)

📌 Resumo do Módulo

Framework vs cérebro — /model troca o modelo, não o resto.
Raciocínio — Opus 4.7/4.8 com teto de gasto.
Volume — GPT (OAuth) e Grok (com X).
Quase de graça — DeepSeek V4 flash: ~95% por ~1% do custo.
Multi-brain — caixa de ferramentas, não martelo.

Próximo Módulo:

1.7 — Local & Privado