TRILHA 2

🛠️ Mao na massa

Chega de teoria — hora de instalar. Voce vai colocar o Ollama no seu computador, escolher um modelo que caiba no seu hardware, baixar e conversar com ele, preparar o modelo do agente (Qwen 3 Coder com 64k de contexto) e ligar tudo ao Agente Hermes — desktop, terminal ou Telegram. Cada modulo traz comandos prontos pra copiar e colar.

Os quatro passos praticos desta trilha, da esquerda pra direita: instalar o Ollama, baixar um modelo, criar a versao de 64k e plugar tudo no Agente Hermes — chegando a um agente rodando 100% na sua maquina.

Modulos

Topicos

~3h

Duracao

Pratico

Nivel

Progresso da trilha0%

0 de 36 topicos

Mapa da trilha

2.1~30 min

⬇️ Instalar o Ollama

Um comando e pronto

2.2~30 min

🎚️ O modelo certo

Caber no seu hardware

2.3~30 min

💬 Seu 1o modelo

Baixar e conversar

2.4~30 min

🪟 O modelo do agente

Qwen 3 Coder 64k

2.5~30 min

🔌 Conectar ao Hermes

Modelo local plugado

2.6~30 min

🖥️ Desktop e Telegram

Tres jeitos de falar

Conteudo detalhado

2.1~30 min

⬇️ Instalar o Ollama

O primeiro passo pratico: pegar o Ollama no site, instalar via terminal (Mac/Linux) ou pelo instalador (Windows), e conferir que tudo funcionou — com comandos prontos pra colar.

0 de 6 · 0%

O que e:

Voce comeca no site oficial ollama.com, onde tem o botao Download e o comando de instalacao.

Por que aprender:

Pegar da fonte oficial evita versoes falsas e garante o instalador certo pro seu sistema.

Conceitos-chave:

Fonte oficial, Download, deteccao de sistema.

O que e:

No Mac/Linux, um unico comando (curl ... | sh) baixa e instala o Ollama de uma vez.

Por que aprender:

E o jeito mais rapido e o que voce vai colar de verdade — sem clicar em telas.

Conceitos-chave:

curl, pipe para sh, script de instalacao.

O que e:

No Windows (e tambem no Mac) da pra baixar o instalador no site e clicar pra instalar.

Por que aprender:

Se voce nao curte terminal, esse e o caminho sem linha de comando.

Conceitos-chave:

Instalador grafico, app de bandeja.

O que e:

Rodar ollama --version e ollama list confirma que ele esta instalado e respondendo.

Por que aprender:

Verificar antes de seguir evita perder tempo depois com erro de "comando nao encontrado".

Conceitos-chave:

Verificacao, --version, list vazia.

O que e:

O Ollama tem um app com janela e tambem comandos de terminal — fazem a mesma coisa.

Por que aprender:

Saber que os dois existem te deixa escolher o que for mais confortavel.

Conceitos-chave:

GUI vs CLI, mesmo motor por baixo.

O que e:

O erro mais comum e o terminal nao "ver" o ollama recem-instalado — basta reabrir o terminal.

Por que aprender:

Resolve 90% dos sustos de instalacao sem precisar reinstalar nada.

Conceitos-chave:

PATH, reabrir o terminal, sessao nova.

Ver Completo

2.2~30 min

🎚️ Escolher o modelo certo pro seu hardware

Antes de baixar gigabytes, descubra o que sua maquina aguenta: leia o hardware, peca uma recomendacao ao Hermes, entenda os niveis de esforco e a regra de deixar folga de RAM.

0 de 6 · 0%

O que e:

Olhar quanta memoria (RAM) e qual chip voce tem — no Mac, em "Sobre este Mac".

Por que aprender:

A RAM e o que decide qual modelo cabe; sem isso voce baixa as cegas.

Conceitos-chave:

RAM, chip/GPU, "Sobre este Mac".

O que e:

Voce mostra seu hardware ao Hermes e ele sugere modelos que cabem (ex.: M4 Max 36GB → Qwen 32B / 30B-A3B).

Por que aprender:

Tira o chute da escolha; o proprio agente ja te aponta o caminho.

Conceitos-chave:

Recomendacao por hardware, opcoes por tamanho.

O que e:

No seletor do Hermes voce ajusta o esforco (Minimal, Low, Medium, High, Max) e toggles Thinking/Fast.

Por que aprender:

E como voce equilibra qualidade e velocidade sem trocar de modelo.

Conceitos-chave:

Effort, Thinking, Fast.

O que e:

O modelo precisa caber na RAM com sobra pro resto do sistema; cheio demais trava a maquina.

Por que aprender:

Evita o erro classico de escolher o maior modelo e a maquina engasgar.

Conceitos-chave:

Headroom, folga de RAM, baixar→testar→apagar.

O que e:

O sufixo q4_K_M indica um modelo quantizado (comprimido), que ocupa menos memoria.

Por que aprender:

Entender quantizacao te deixa caber modelos maiores na mesma RAM.

Conceitos-chave:

Quantizacao, q4_K_M, tamanho vs precisao.

O que e:

Uma recomendacao concreta pra comecar: o qwen3:30b-a3b-q4_K_M, rapido e equilibrado.

Por que aprender:

Comecar com um modelo testado evita paralisia de escolha.

Conceitos-chave:

Primeiro modelo, qwen3:30b-a3b-q4_K_M.

Ver Completo

2.3~30 min

💬 Baixar e conversar com seu 1o modelo

O momento "uau": baixar o modelo, rodar no terminal ou no app, entender o "thinking" e gerenciar o que esta no disco — tudo rodando offline na sua maquina.

0 de 6 · 0%

O que e:

O comando ollama pull baixa o modelo escolhido (uns 18 GB) para o seu disco, com barra de progresso.

Por que aprender:

E o unico momento que precisa de internet; depois roda offline.

Conceitos-chave:

pull, download unico, barra de progresso.

O que e:

ollama run abre um chat no proprio terminal; voce digita, ele responde, e sai com /bye.

Por que aprender:

E a forma mais direta de provar que o modelo local funciona.

Conceitos-chave:

run, prompt no terminal, /bye.

O que e:

O app do Ollama tem uma janela de chat; escolhe o modelo na lista e conversa como num app comum.

Por que aprender:

E o caminho confortavel pra quem prefere o mouse ao teclado.

Conceitos-chave:

App de chat, seletor de modelo.

O que e:

Modelos de raciocinio "pensam" antes de responder; o app mostra algo como "Thought for 6.2 seconds".

Por que aprender:

Explica por que a resposta demora um pouco — e por que costuma ser melhor.

Conceitos-chave:

Thinking, raciocinio, tempo de "pensar".

O que e:

Na primeira pergunta o modelo carrega na memoria e demora mais; depois fica mais rapido.

Por que aprender:

Saber disso evita achar que "travou" logo de cara.

Conceitos-chave:

Cold start, carregar em RAM, aquecimento.

O que e:

ollama list mostra o que voce baixou, ollama ps o que esta rodando, ollama rm apaga um modelo.

Por que aprender:

Voce vai testar varios; apagar os que nao usa libera disco.

Conceitos-chave:

list, ps, rm, limpeza de disco.

Ver Completo

2.4~30 min

🪟 O modelo do agente: Qwen 3 Coder 64k

O agente exige 64k de contexto. Voce vai entender por que, conhecer o Qwen 3 Coder, escrever um Modelfile que sobe o num_ctx e criar o modelo derivado de 64k com um comando.

0 de 6 · 0%

O que e:

O Agente Hermes precisa de um modelo com 64.000 tokens de contexto; o do modulo 2.3 nem sempre tem.

Por que aprender:

E o motivo de preparar um modelo especifico antes de conectar o agente.

Conceitos-chave:

Requisito de 64k, modelo do agente.

O que e:

Um modelo aberto da familia Qwen voltado a codigo e uso de ferramentas — ideal pra agente.

Por que aprender:

Saber por que ele e escolhido te ajuda a trocar com criterio depois.

Conceitos-chave:

Qwen 3 Coder, modelo p/ agente, tools.

O que e:

Um Modelfile e uma receita curta: parte de um modelo base e ajusta o num_ctx para 65536 (64k).

Por que aprender:

E como voce "fabrica" o modelo de 64k a partir de um que ja tem.

Conceitos-chave:

Modelfile, FROM, PARAMETER num_ctx 65536.

O que e:

ollama create qwen3-coder-64k -f Modelfile gera um novo modelo com o contexto ja em 64k.

Por que aprender:

Esse modelo derivado e o que voce vai apontar pro Hermes no modulo 2.5.

Conceitos-chave:

create, modelo derivado, -f Modelfile.

O que e:

ollama show qwen3-coder-64k e ollama list confirmam que o modelo existe e tem 64k.

Por que aprender:

Verificar antes de plugar no agente evita erro de contexto la na frente.

Conceitos-chave:

show, list, conferir o num_ctx.

O que e:

Contexto maior consome mais RAM; 64k pesa mais que o contexto padrao do mesmo modelo.

Por que aprender:

Liga de volta a regra do headroom: precisa de folga pra rodar o agente.

Conceitos-chave:

Custo de memoria do contexto, headroom.

Ver Completo

2.5~30 min

🔌 Conectar o modelo local ao Agente Hermes

A ligacao final: instalar/atualizar o Hermes (open-source, MIT, Nous Research), selecionar o modelo local de 64k, diagnosticar e testar a conexao rodando 100% offline.

0 de 6 · 0%

O que e:

O Hermes Agent e o "SO de IA" open-source da Nous Research, com licenca MIT.

Por que aprender:

Open-source + MIT = voce roda, audita e adapta sem amarras.

Conceitos-chave:

Open-source, licenca MIT, Nous Research.

O que e:

hermes update deixa o Hermes na ultima versao; ao terminar aparece "HERMES IS READY".

Por que aprender:

Comecar atualizado evita bugs ja corrigidos.

Conceitos-chave:

hermes update, "HERMES IS READY".

O que e:

No seletor do Hermes voce escolhe o qwen3-coder-64k; o modelo ativo aparece no canto inferior direito.

Por que aprender:

E o passo que faz o agente usar o SEU modelo local em vez da nuvem.

Conceitos-chave:

Seletor de modelo, canto inferior direito.

O que e:

O Hermes so funciona bem com o modelo de 64k; por isso voce preparou o derivado antes.

Por que aprender:

Fecha o circulo: o modulo 2.4 existe exatamente pra este momento.

Conceitos-chave:

Exigencia de contexto, modelo certo.

O que e:

hermes doctor checa a saude da instalacao e hermes status mostra o estado atual.

Por que aprender:

Sao seus primeiros comandos quando algo nao conecta.

Conceitos-chave:

hermes doctor, hermes status.

O que e:

Mande um "oi" no Hermes com o modelo local selecionado e veja a resposta vir da sua maquina.

Por que aprender:

E a prova final de que o agente esta rodando 100% local.

Conceitos-chave:

Teste de fumaca, resposta local.

Ver Completo

2.6~30 min

🖥️ App desktop, terminal e Telegram

Tres jeitos de falar com o Hermes: o app desktop (amigavel), o terminal (poderoso) e o Telegram (de qualquer lugar) — alem de sessions, branch/fork e artifacts.

0 de 6 · 0%

O que e:

Uma janela de aplicativo do Hermes, mais amigavel que o terminal pra quem esta comecando.

Por que aprender:

E o caminho de menor atrito pra usar o agente no dia a dia.

Conceitos-chave:

App desktop, interface grafica.

O que e:

Pelo terminal voce roda hermes dashboard, hermes setup e os demais comandos do agente.

Por que aprender:

O terminal e o caminho mais poderoso e automatizavel.

Conceitos-chave:

hermes dashboard, hermes setup.

O que e:

Da pra conversar com o agente pelo Telegram, como quem manda mensagem pra um contato.

Por que aprender:

E o que te deixa usar o agente do celular, de qualquer lugar (Projeto 7 da Trilha 3).

Conceitos-chave:

Telegram, acesso remoto, chat.

O que e:

Cada conversa e uma "session"; voce abre New session e o Hermes guarda o historico.

Por que aprender:

Organizar por sessions mantem contextos separados (trabalho, estudo, etc.).

Conceitos-chave:

Session, New session, historico.

O que e:

Voce pode "forkar" uma conversa num ponto e seguir por dois caminhos diferentes.

Por que aprender:

Permite testar abordagens sem perder a linha original.

Conceitos-chave:

Branch, fork, linhas paralelas.

O que e:

As saidas do agente (codigo, textos, arquivos) podem ser salvas e revisitadas como artifacts.

Por que aprender:

E onde o trabalho do agente "fica", pronto pra usar depois.

Conceitos-chave:

Artifacts, saidas salvas, reuso.

Ver Completo

← Trilha 1: Fundamentos Trilha 3: Projetos →