Módulo 1.6 · Escolhendo o Modelo

🧩 Framework vs cérebro

O Hermes é o framework agêntico (a estrutura que age); o "cérebro" é um modelo plugável. O comando /model troca esse cérebro sem mexer no resto.

Trocar o cérebro (ilustrativo)

/model opus-4.8      ← raciocínio pesado
/model gpt           ← volume geral
/model deepseek      ← quase de graça

🧬 Model-agnostic

Como o framework não depende de um modelo específico, você fica livre para usar o melhor cérebro para cada tarefa. Essa separação é o coração da estratégia multi-brain.

🧠 Para raciocínio: Opus com teto

Para raciocínio pesado, use Opus 4.7/4.8 via OpenRouter, com teto de gasto (ex.: US$10/mês e para). Modelo caro só no que vale a pena.

📊 Como controlar o custo

•Defina um teto mensal (ex.: US$10) — ao bater, para
•Reserve o Opus para tarefas difíceis, não para tudo
•Acesse via OpenRouter para comparar custo facilmente

💡 Dica prática

O teto de gasto é a sua rede de segurança. Sem ele, raciocínio pesado pode queimar dinheiro rápido (ver Trilha 3, módulo de budget).

⚡ Para volume: GPT e Grok

Para tarefas gerais de alto volume: use GPT (seu ChatGPT via OAuth aproveita a assinatura de US$20) ou Grok (com o X conectado, ele busca no Twitter).

GPT via OAuth

Conecte o seu ChatGPT e aproveite a assinatura de US$20 que você já paga.

Grok + X

Bom para volume e, com o X conectado, busca direta no Twitter.

💡 Dica prática

Use o que você já assina. Conectar o ChatGPT via OAuth (módulo 1.5) transforma a assinatura existente no "cérebro de volume" do Hermes.

🆓 Quase de graça: DeepSeek e free

DeepSeek e modelos free rodam quase de graça. O dado que importa: o DeepSeek V4 flash entrega ~95% da performance por ~1% do custo.

📊 O número que muda tudo

~95% da performance de um modelo de ponta
~1% do custo
Ideal para autopilot e tarefas de fundo de alto volume

✓ Use modelo barato em

✓Tarefas de fundo, em volume
✓Autopilot e automações repetitivas
✓Quando 95% já basta

✗ Evite em

✗Raciocínio de alto impacto
✗Decisões críticas onde 5% importa
✗Tarefas que exigem o melhor cérebro

🔌 OpenRouter: um hub, muitos modelos

O OpenRouter é 1 conexão que dá acesso a centenas de modelos, com rankings de performance e custo para comparar antes de escolher.

🗺️ Por que centralizar

•Uma chave/conexão para muitos modelos
•Rankings ajudam a achar o melhor custo-benefício
•Trocar de modelo (/model) fica trivial

Onde comparar

# rankings de modelos (performance × custo)
openrouter.ai/models

🔨 "Para um martelo, tudo é prego"

Usar um único modelo para tudo é como ter só um martelo: tudo vira prego. A estratégia multi-brain é variar a ferramenta conforme a tarefa.

🧠

Raciocínio difícil → Opus

Com teto de gasto, no que realmente importa.

⚡

Volume geral → GPT/Grok

Aproveitando assinaturas que você já tem.

🆓

Tarefas de fundo → DeepSeek/free

~95% da performance por ~1% do custo.

💡 Dica prática

Pense no Hermes como uma caixa de ferramentas, não um martelo. Trocar de cérebro por tarefa é o que dá o melhor resultado pelo menor custo.

🧯 Erros comuns na escolha do modelo

A maioria dos desperdícios de custo vem de usar o cérebro errado para a tarefa. Veja o que fazer e o que evitar.

✓ Faça

✓Modelo caro só em tarefas de alto impacto
✓Defina teto de gasto no Opus
✓Consulte rankings antes de escolher

✗ Evite

✗Usar Opus para tudo (queima dinheiro)
✗Ignorar assinaturas que você já paga
✗Fixar um único modelo (o "martelo")

Guia de bolso (ilustrativo)

raciocínio difícil  -> Opus 4.7/4.8  (teto US$10/mês)
volume geral        -> GPT (OAuth) / Grok (com X)
tarefa de fundo     -> DeepSeek V4 flash (~95% perf, ~1% custo)
acesso a tudo       -> OpenRouter (1 conexão, rankings)

📌 Resumo do Módulo

✓

Framework vs cérebro — /model troca o modelo, não o resto.

✓

Raciocínio — Opus 4.7/4.8 com teto de gasto.

✓

Volume — GPT (OAuth) e Grok (com X).

✓

Quase de graça — DeepSeek V4 flash: ~95% por ~1% do custo.

✓

Multi-brain — caixa de ferramentas, não martelo.

Próximo Módulo:

1.7 — Local & Privado

← Voltar para Trilha Próximo Módulo →