Módulo 1.7 · Local & Privado

🏠 O modelo na sua máquina

Atenção à diferença com o módulo 1.4: lá, o Hermes rodava local. Aqui, o próprio MODELO de IA roda na sua máquina — nada precisa sair do seu computador.

🧬 O que muda

•Antes: o cérebro estava num servidor remoto (API/OAuth)
•Agora: o cérebro roda dentro da sua máquina
•Consequência: privacidade total e funcionamento offline

💡 Dica prática

"Local-hosted" pode significar dois níveis: o Hermes local (1.4) e o modelo local (este módulo). O segundo é o que garante privacidade absoluta.

⚖️ O trade-off: limitado pelo hardware

Modelos grandes têm bilhões de parâmetros e precisam de datacenter. No local, você é limitado pelo seu hardware — privacidade custa performance e velocidade.

✓ O que você ganha

✓Privacidade 100% — nada sai da máquina
✓Funciona offline
✓Sem custo por token

✗ O que você abre mão

✗Menos performance que servidores enormes
✗Menos velocidade
✗Teto definido pelo seu hardware

📐 Como dimensionar

Não chute o que cabe. Vá em Apple → Sobre Este Mac, mande um screenshot ao Hermes e pergunte: "qual o modelo local mais poderoso que eu rodo?".

Abra "Sobre Este Mac"

Menu Apple → Sobre Este Mac. Ali estão memória, chip e specs.

Mande o screenshot ao Hermes

Ele lê as specs com visão e entende o que sua máquina aguenta.

Pergunte o modelo ideal

"Qual o modelo local mais poderoso que eu rodo?" — ele recomenda.

💡 Dica prática

Deixar o Hermes ler suas specs evita o erro de baixar um modelo grande demais que trava a máquina.

🦙 Baixar via Ollama

A ferramenta-padrão para rodar modelos localmente é o Ollama. Exemplos: Gemma, Qwen 32B/3.6, ou opções Cloud free.

Baixar e rodar (ilustrativo)

$ ollama pull gemma       # modelo pequeno, leve
$ ollama pull qwen:32b    # mais potente, exige mais RAM
$ ollama run gemma        # conversa local, offline

📊 Opções comuns

•Gemma — leve, bom ponto de partida
•Qwen 32B / 3.6 — mais potente, exige mais hardware
•Cloud free — quando o local não dá conta

🔒 100% privado e offline

Como tudo roda local, é 100% privado e funciona offline: a 1000 ft abaixo da terra, voando num avião ou até no espaço.

⛏️

1000 ft abaixo

✈️

Voando

🚀

No espaço

🛡️ O grande argumento do local

Nada sai da sua máquina. Para quem lida com dados sensíveis ou precisa operar sem rede, é a diferença entre poder ou não usar IA.

•Sem dependência de internet
•Nenhum dado enviado a servidores externos

🧭 Quando vale a pena

O local vale quando privacidade ou operação offline são inegociáveis. Para máxima potência, modelos em nuvem ainda ganham — é uma decisão por prioridade.

✓ Prefira local quando

✓Privacidade é inegociável
✓Precisa funcionar sem internet
✓Quer custo zero por uso

✗ Prefira nuvem quando

✗Precisa de máxima potência/velocidade
✗Seu hardware é limitado
✗A tarefa exige o melhor modelo possível

Fecha a Trilha 1: você já sabe o que é um agente, o que é o Hermes, onde ele vive, como conectar modelos e como rodar tudo local. A Trilha 2 entra nas capacidades (memória, soul, MCPs).

🧯 Erros comuns ao rodar local

Quem testa modelos locais costuma esbarrar nos mesmos problemas. Antecipe-os para não travar a máquina nem se frustrar com a performance.

✓ Faça

✓Confira as specs antes (mande o screenshot)
✓Comece com um modelo leve (Gemma) e suba
✓Use local quando privacidade/offline mandam

✗ Evite

✗Baixar um modelo grande demais e travar tudo
✗Esperar performance de datacenter no laptop
✗Insistir no local quando a tarefa pede potência

Decisão de bolso (ilustrativo)

privacidade inegociável / offline  -> 🔒 modelo LOCAL (Ollama)
máxima potência / hardware fraco   -> 🌐 modelo em NUVEM (API/OAuth)
não sei o que cabe                 -> mande specs ao Hermes e pergunte

📌 Resumo do Módulo

✓

Modelo local — não só o Hermes, o próprio modelo roda na máquina.

✓

Trade-off — limitado pelo hardware; menos performance/velocidade.

✓

Dimensionar — screenshot do "Sobre Este Mac" → pergunte ao Hermes.

✓

Ollama — Gemma, Qwen 32B/3.6, Cloud free.

✓

Privado & offline — 1000 ft abaixo da terra, voando ou no espaço.

Próxima Trilha:

Trilha 2 — Capacidades (memória, soul, integrações, MCPs)

← Voltar para Trilha Trilha 2: Capacidades →