🏠 O modelo na sua máquina
Atenção à diferença com o módulo 1.4: lá, o Hermes rodava local. Aqui, o próprio MODELO de IA roda na sua máquina — nada precisa sair do seu computador.
🧬 O que muda
- •Antes: o cérebro estava num servidor remoto (API/OAuth)
- •Agora: o cérebro roda dentro da sua máquina
- •Consequência: privacidade total e funcionamento offline
💡 Dica prática
"Local-hosted" pode significar dois níveis: o Hermes local (1.4) e o modelo local (este módulo). O segundo é o que garante privacidade absoluta.
⚖️ O trade-off: limitado pelo hardware
Modelos grandes têm bilhões de parâmetros e precisam de datacenter. No local, você é limitado pelo seu hardware — privacidade custa performance e velocidade.
✓ O que você ganha
- ✓Privacidade 100% — nada sai da máquina
- ✓Funciona offline
- ✓Sem custo por token
✗ O que você abre mão
- ✗Menos performance que servidores enormes
- ✗Menos velocidade
- ✗Teto definido pelo seu hardware
📐 Como dimensionar
Não chute o que cabe. Vá em Apple → Sobre Este Mac, mande um screenshot ao Hermes e pergunte: "qual o modelo local mais poderoso que eu rodo?".
Abra "Sobre Este Mac"
Menu Apple → Sobre Este Mac. Ali estão memória, chip e specs.
Mande o screenshot ao Hermes
Ele lê as specs com visão e entende o que sua máquina aguenta.
Pergunte o modelo ideal
"Qual o modelo local mais poderoso que eu rodo?" — ele recomenda.
💡 Dica prática
Deixar o Hermes ler suas specs evita o erro de baixar um modelo grande demais que trava a máquina.
🦙 Baixar via Ollama
A ferramenta-padrão para rodar modelos localmente é o Ollama. Exemplos: Gemma, Qwen 32B/3.6, ou opções Cloud free.
Baixar e rodar (ilustrativo)
$ ollama pull gemma # modelo pequeno, leve $ ollama pull qwen:32b # mais potente, exige mais RAM $ ollama run gemma # conversa local, offline
📊 Opções comuns
- •Gemma — leve, bom ponto de partida
- •Qwen 32B / 3.6 — mais potente, exige mais hardware
- •Cloud free — quando o local não dá conta
🔒 100% privado e offline
Como tudo roda local, é 100% privado e funciona offline: a 1000 ft abaixo da terra, voando num avião ou até no espaço.
🛡️ O grande argumento do local
Nada sai da sua máquina. Para quem lida com dados sensíveis ou precisa operar sem rede, é a diferença entre poder ou não usar IA.
- •Sem dependência de internet
- •Nenhum dado enviado a servidores externos
🧭 Quando vale a pena
O local vale quando privacidade ou operação offline são inegociáveis. Para máxima potência, modelos em nuvem ainda ganham — é uma decisão por prioridade.
✓ Prefira local quando
- ✓Privacidade é inegociável
- ✓Precisa funcionar sem internet
- ✓Quer custo zero por uso
✗ Prefira nuvem quando
- ✗Precisa de máxima potência/velocidade
- ✗Seu hardware é limitado
- ✗A tarefa exige o melhor modelo possível
Fecha a Trilha 1: você já sabe o que é um agente, o que é o Hermes, onde ele vive, como conectar modelos e como rodar tudo local. A Trilha 2 entra nas capacidades (memória, soul, MCPs).
🧯 Erros comuns ao rodar local
Quem testa modelos locais costuma esbarrar nos mesmos problemas. Antecipe-os para não travar a máquina nem se frustrar com a performance.
✓ Faça
- ✓Confira as specs antes (mande o screenshot)
- ✓Comece com um modelo leve (Gemma) e suba
- ✓Use local quando privacidade/offline mandam
✗ Evite
- ✗Baixar um modelo grande demais e travar tudo
- ✗Esperar performance de datacenter no laptop
- ✗Insistir no local quando a tarefa pede potência
Decisão de bolso (ilustrativo)
privacidade inegociável / offline -> 🔒 modelo LOCAL (Ollama) máxima potência / hardware fraco -> 🌐 modelo em NUVEM (API/OAuth) não sei o que cabe -> mande specs ao Hermes e pergunte
📌 Resumo do Módulo
Próxima Trilha:
Trilha 2 — Capacidades (memória, soul, integrações, MCPs)