MÓDULO 1.7

💻 Local & Privado

Rodar o MODELO na sua máquina, não só o Hermes. O trade-off: você é limitado pelo hardware, mas ganha privacidade total e operação offline — a 1000 ft abaixo da terra, voando ou no espaço.

Gemma (pequeno)hardware: leve Qwen 32Bhardware: médio o maior que cabelimite do SEU hardware modelos gigantesprecisam de datacenter 🔒 privado + offline
6
Tópicos
24
Minutos
Básico
Nível
Prático
Tipo
1

🏠 O modelo na sua máquina

Atenção à diferença com o módulo 1.4: lá, o Hermes rodava local. Aqui, o próprio MODELO de IA roda na sua máquina — nada precisa sair do seu computador.

🧬 O que muda

  • Antes: o cérebro estava num servidor remoto (API/OAuth)
  • Agora: o cérebro roda dentro da sua máquina
  • Consequência: privacidade total e funcionamento offline

💡 Dica prática

"Local-hosted" pode significar dois níveis: o Hermes local (1.4) e o modelo local (este módulo). O segundo é o que garante privacidade absoluta.

2

⚖️ O trade-off: limitado pelo hardware

Modelos grandes têm bilhões de parâmetros e precisam de datacenter. No local, você é limitado pelo seu hardware — privacidade custa performance e velocidade.

✓ O que você ganha

  • Privacidade 100% — nada sai da máquina
  • Funciona offline
  • Sem custo por token

✗ O que você abre mão

  • Menos performance que servidores enormes
  • Menos velocidade
  • Teto definido pelo seu hardware
3

📐 Como dimensionar

Não chute o que cabe. Vá em Apple → Sobre Este Mac, mande um screenshot ao Hermes e pergunte: "qual o modelo local mais poderoso que eu rodo?".

1

Abra "Sobre Este Mac"

Menu Apple → Sobre Este Mac. Ali estão memória, chip e specs.

2

Mande o screenshot ao Hermes

Ele lê as specs com visão e entende o que sua máquina aguenta.

3

Pergunte o modelo ideal

"Qual o modelo local mais poderoso que eu rodo?" — ele recomenda.

💡 Dica prática

Deixar o Hermes ler suas specs evita o erro de baixar um modelo grande demais que trava a máquina.

4

🦙 Baixar via Ollama

A ferramenta-padrão para rodar modelos localmente é o Ollama. Exemplos: Gemma, Qwen 32B/3.6, ou opções Cloud free.

Baixar e rodar (ilustrativo)

$ ollama pull gemma       # modelo pequeno, leve
$ ollama pull qwen:32b    # mais potente, exige mais RAM
$ ollama run gemma        # conversa local, offline

📊 Opções comuns

  • Gemma — leve, bom ponto de partida
  • Qwen 32B / 3.6 — mais potente, exige mais hardware
  • Cloud free — quando o local não dá conta
5

🔒 100% privado e offline

Como tudo roda local, é 100% privado e funciona offline: a 1000 ft abaixo da terra, voando num avião ou até no espaço.

⛏️
1000 ft abaixo
✈️
Voando
🚀
No espaço

🛡️ O grande argumento do local

Nada sai da sua máquina. Para quem lida com dados sensíveis ou precisa operar sem rede, é a diferença entre poder ou não usar IA.

  • Sem dependência de internet
  • Nenhum dado enviado a servidores externos
6

🧭 Quando vale a pena

O local vale quando privacidade ou operação offline são inegociáveis. Para máxima potência, modelos em nuvem ainda ganham — é uma decisão por prioridade.

✓ Prefira local quando

  • Privacidade é inegociável
  • Precisa funcionar sem internet
  • Quer custo zero por uso

✗ Prefira nuvem quando

  • Precisa de máxima potência/velocidade
  • Seu hardware é limitado
  • A tarefa exige o melhor modelo possível

Fecha a Trilha 1: você já sabe o que é um agente, o que é o Hermes, onde ele vive, como conectar modelos e como rodar tudo local. A Trilha 2 entra nas capacidades (memória, soul, MCPs).

7

🧯 Erros comuns ao rodar local

Quem testa modelos locais costuma esbarrar nos mesmos problemas. Antecipe-os para não travar a máquina nem se frustrar com a performance.

✓ Faça

  • Confira as specs antes (mande o screenshot)
  • Comece com um modelo leve (Gemma) e suba
  • Use local quando privacidade/offline mandam

✗ Evite

  • Baixar um modelo grande demais e travar tudo
  • Esperar performance de datacenter no laptop
  • Insistir no local quando a tarefa pede potência

Decisão de bolso (ilustrativo)

privacidade inegociável / offline  -> 🔒 modelo LOCAL (Ollama)
máxima potência / hardware fraco   -> 🌐 modelo em NUVEM (API/OAuth)
não sei o que cabe                 -> mande specs ao Hermes e pergunte

📌 Resumo do Módulo

Modelo local — não só o Hermes, o próprio modelo roda na máquina.
Trade-off — limitado pelo hardware; menos performance/velocidade.
Dimensionar — screenshot do "Sobre Este Mac" → pergunte ao Hermes.
Ollama — Gemma, Qwen 32B/3.6, Cloud free.
Privado & offline — 1000 ft abaixo da terra, voando ou no espaço.

Próxima Trilha:

Trilha 2 — Capacidades (memória, soul, integrações, MCPs)