MODULO 2.5

๐Ÿ”Œ Conectar o modelo local ao Agente Hermes

Voce ja tem o cerebro (o qwen3-coder-64k) e o corpo vem agora: o Agente Hermes. Neste modulo voce instala/atualiza o Hermes, aponta ele para o seu modelo local e prova que tudo roda 100% na sua maquina โ€” sem nenhuma chamada para a nuvem.

6
Topicos
~25
Minutos
Pratico
Nivel
Hands-on
Tipo
1

๐ŸŒ O que e o Agente Hermes

O Agente Hermes e o "SO de IA" que vimos na Trilha 1: o lar onde memoria, skills, conexoes e agentes vivem. Ele e open-source, com licenca MIT, mantido pela Nous Research. Por baixo, o Hermes precisa de um modelo que faca o raciocinio โ€” e e aqui que o seu qwen3-coder-64k entra.

Site do Agente Hermes, da Nous Research, mostrando que e open-source com licenca MIT e o lema THE AGENT GROWS YOU
Frame do site oficial: repare em open-source / MIT license e na assinatura Nous Research. Open-source + MIT significa que voce pode ler, rodar e modificar o codigo livremente โ€” combina com a tese de posse do curso.

Novo aqui? "Open-source" quer dizer que o codigo e aberto para qualquer um ver e usar. "Licenca MIT" e uma das licencas mais permissivas: voce pode usar, copiar e ate alterar, comercialmente, mantendo o aviso de autoria. E o oposto de uma caixa-preta fechada.

Conceitos-chave

Agente Hermes

O SO de IA que conecta memoria, skills e modelos.

Open-source MIT

Codigo aberto e licenca permissiva.

Nous Research

A organizacao por tras do Hermes.

Precisa de um modelo

O Hermes raciocina usando o modelo que voce apontar.

2

โฌ‡๏ธ Instalar / atualizar o Hermes

Com o Hermes ja no sistema, o comando que garante a versao mais recente e o hermes update. No video, depois dele, aparece o painel "HERMES IS READY" com o botao Launch Hermes โ€” sinal de que o agente esta pronto para abrir.

๐ŸŽฏ Objetivo

Atualizar o Hermes para a ultima versao e confirmar que ele ficou pronto.

hermes update

Como verificar: ao terminar, surge o painel HERMES IS READY com Launch Hermes. Se quiser uma checagem rapida do estado a qualquer momento, rode hermes status.

Terminal executando hermes update e o painel HERMES IS READY com o botao Launch Hermes
Frame do video: o terminal roda hermes update e o resultado e o painel HERMES IS READY. Esse "READY" e o seu sinal verde para seguir para a conexao do modelo no proximo topico.

Conceitos-chave

hermes update

Atualiza o Hermes para a ultima versao.

HERMES IS READY

Painel que confirma que esta pronto.

Launch Hermes

Botao que abre o agente.

hermes status

Checagem rapida do estado atual.

3

๐Ÿ”— Selecionar o modelo local

Esta parte e na interface do Hermes, nao no terminal. No seletor de modelo, voce escolhe um modelo local em vez de um da nuvem โ€” no nosso caso, o qwen3-coder-64k que criamos no modulo 2.4. Depois de selecionado, o modelo ativo aparece no canto inferior direito da tela.

๐Ÿ–ฑ๏ธ Passos na interface (descritos fiel ao video)

1

Abrir o seletor de modelo

No Hermes, abra a lista de modelos. Modelos locais (do Ollama) aparecem junto com os da nuvem.

2

Escolher o qwen3-coder-64k

Selecione o modelo local que voce criou. E ele que dara ao agente os 64k de contexto.

3

Confirmar no canto inferior direito

O modelo ativo aparece no canto inferior direito. Se la estiver escrito o nome do seu modelo local, a conexao esta feita.

Honestidade: os nomes exatos de menus podem mudar entre versoes do Hermes. O importante e o fluxo โ€” abrir o seletor, escolher um modelo local, e ver o nome dele no canto inferior direito. Nao ha "flag de CLI" para isso: e uma acao na interface.

Conceitos-chave

Seletor de modelo

Onde se escolhe local ou nuvem, na UI.

Modelo local

O do Ollama (qwen3-coder-64k), nao da nuvem.

Canto inferior direito

Onde o modelo ativo e exibido.

Acao na UI

Conectar e clicar, nao digitar comando.

4

๐Ÿ“ A exigencia dos 64k

Agora fica claro por que fizemos o trabalho do modulo 2.4. O Hermes precisa de uma janela grande para caber o sistema do agente โ€” instrucoes, memoria, descricoes de ferramentas e o historico da conversa. Se voce apontar um modelo de contexto curto, o agente trava ou esquece coisas no meio do caminho.

a janela de 64k do modelo local instrucoes do agente descricoes de ferramentas memoria / contexto da tarefa historico da conversa Agente Hermes usa o modelo local p/ raciocinar contexto curto = a janela enche e o agente "esquece" โ€” por isso 64k

Tudo o que o agente precisa lembrar (instrucoes, ferramentas, memoria e conversa) divide a mesma janela. Com 64k, sobra espaco; com contexto curto, a janela lota e o agente perde o fio โ€” exatamente o problema que o qwen3-coder-64k resolve.

๐Ÿ’ก Dica pratica

Se o agente comecar a ignorar instrucoes ou "se perder" no meio de uma tarefa, suspeite do contexto. Confirme que o modelo selecionado e o de 64k (e nao o de chat) olhando o canto inferior direito.

Conceitos-chave

Sistema do agente

Instrucoes + ferramentas que ocupam contexto.

Janela cheia

Contexto curto enche e o agente esquece.

Por isso o 2.4

O modelo 64k existe para alimentar o Hermes.

Modelo errado = falha

Selecionar o de chat trava o agente.

5

๐Ÿฉบ Diagnostico quando algo nao bate

Se a conexao parecer estranha, o Hermes traz dois comandos de saude. O hermes status mostra o estado geral; o hermes doctor faz uma checagem mais funda e aponta problemas comuns. Sao os primeiros lugares para olhar antes de mexer em qualquer outra coisa.

๐ŸŽฏ Objetivo

Conferir o estado do Hermes e rodar um diagnostico quando a conexao do modelo nao parecer correta.

hermes status
hermes doctor

Como verificar: hermes status resume o estado atual; hermes doctor lista checagens e sinaliza o que estiver fora do lugar. Se ele apontar algo (ex.: Ollama nao acessivel), resolva isso primeiro e rode de novo.

โœ“ Antes de pedir ajuda

  • โœ“O Ollama esta rodando? (ollama list responde)
  • โœ“O modelo 64k aparece em ollama list?
  • โœ“O canto inferior direito mostra o modelo local?
  • โœ“hermes doctor sem alertas vermelhos?

โœ— Armadilhas comuns

  • โœ—Ollama fechado: o Hermes nao acha o modelo.
  • โœ—Selecionou o modelo de chat, nao o de 64k.
  • โœ—RAM no limite: o modelo nem carrega.
  • โœ—Esqueceu o hermes update e esta numa versao velha.

Conceitos-chave

hermes status

Resumo do estado do agente.

hermes doctor

Checagem profunda; aponta problemas.

Ollama ligado

Pre-requisito: o servico precisa estar de pe.

Resolver e repetir

Corrigir o alerta e rodar o doctor de novo.

6

โœ… Teste a conexao (100% local)

O teste final e simples: com o modelo local selecionado, mande um "oi" ao agente. Se ele responder, voce tem um agente rodando inteiramente na sua maquina. A prova de privacidade vem a seguir: desconecte a internet e mande outra mensagem โ€” se continuar respondendo, nada estava saindo para a nuvem.

1

Mande um "oi"

Com o qwen3-coder-64k ativo, escreva uma mensagem simples e veja a resposta chegar.

2

Desconecte a internet

Desligue o wi-fi (ou tire o cabo). E o teste do "modo Vault" que veremos na Trilha 3.

3

Mande outra mensagem

Se o agente ainda responde sem rede, esta provado: tudo roda local, nada vazou.

๐ŸŽ‰ O que voce acabou de montar

Um agente completo โ€” Hermes + Ollama + qwen3-coder-64k โ€” raciocinando 100% na sua maquina, de graca e sem internet. Esse e o coracao do curso. Na Trilha 3 voce vai usar essa base em projetos reais.

Conceitos-chave

Teste do "oi"

A forma mais rapida de validar a conexao.

Teste offline

Sem rede e ainda responde = prova de local.

Ponte pro Vault

Desconectar e a base do modo airgapped.

Agente completo

Hermes + Ollama + modelo 64k juntos.

Auto-checagem (opcional): qual a melhor prova de que o agente roda 100% local?

๐ŸŽฏ Resumo do modulo

โœ“
Hermes = SO de IA aberto โ€” open-source, licenca MIT, da Nous Research; precisa de um modelo por baixo.
โœ“
hermes update โ€” atualiza e leva ao painel "HERMES IS READY / Launch Hermes".
โœ“
Selecionar o modelo local โ€” na UI, escolha o qwen3-coder-64k; ele aparece no canto inferior direito.
โœ“
Diagnostico e teste โ€” hermes status/doctor para problemas; mande um "oi" offline para provar que e 100% local.

Proximo modulo:

2.6 โ€” App desktop, terminal e Telegram