๐ Conectar o modelo local ao Agente Hermes
Voce ja tem o cerebro (o qwen3-coder-64k) e o corpo vem agora: o Agente Hermes. Neste modulo voce instala/atualiza o Hermes, aponta ele para o seu modelo local e prova que tudo roda 100% na sua maquina โ sem nenhuma chamada para a nuvem.
๐ O que e o Agente Hermes
O Agente Hermes e o "SO de IA" que vimos na Trilha 1: o lar onde memoria, skills, conexoes e agentes vivem. Ele e open-source, com licenca MIT, mantido pela Nous Research. Por baixo, o Hermes precisa de um modelo que faca o raciocinio โ e e aqui que o seu qwen3-coder-64k entra.
Novo aqui? "Open-source" quer dizer que o codigo e aberto para qualquer um ver e usar. "Licenca MIT" e uma das licencas mais permissivas: voce pode usar, copiar e ate alterar, comercialmente, mantendo o aviso de autoria. E o oposto de uma caixa-preta fechada.
Conceitos-chave
O SO de IA que conecta memoria, skills e modelos.
Codigo aberto e licenca permissiva.
A organizacao por tras do Hermes.
O Hermes raciocina usando o modelo que voce apontar.
โฌ๏ธ Instalar / atualizar o Hermes
Com o Hermes ja no sistema, o comando que garante a versao mais recente e o hermes update. No video, depois dele, aparece o painel "HERMES IS READY" com o botao Launch Hermes โ sinal de que o agente esta pronto para abrir.
๐ฏ Objetivo
Atualizar o Hermes para a ultima versao e confirmar que ele ficou pronto.
hermes update
Como verificar: ao terminar, surge o painel HERMES IS READY com Launch Hermes. Se quiser uma checagem rapida do estado a qualquer momento, rode hermes status.
Conceitos-chave
Atualiza o Hermes para a ultima versao.
Painel que confirma que esta pronto.
Botao que abre o agente.
Checagem rapida do estado atual.
๐ Selecionar o modelo local
Esta parte e na interface do Hermes, nao no terminal. No seletor de modelo, voce escolhe um modelo local em vez de um da nuvem โ no nosso caso, o qwen3-coder-64k que criamos no modulo 2.4. Depois de selecionado, o modelo ativo aparece no canto inferior direito da tela.
๐ฑ๏ธ Passos na interface (descritos fiel ao video)
Abrir o seletor de modelo
No Hermes, abra a lista de modelos. Modelos locais (do Ollama) aparecem junto com os da nuvem.
Escolher o qwen3-coder-64k
Selecione o modelo local que voce criou. E ele que dara ao agente os 64k de contexto.
Confirmar no canto inferior direito
O modelo ativo aparece no canto inferior direito. Se la estiver escrito o nome do seu modelo local, a conexao esta feita.
Honestidade: os nomes exatos de menus podem mudar entre versoes do Hermes. O importante e o fluxo โ abrir o seletor, escolher um modelo local, e ver o nome dele no canto inferior direito. Nao ha "flag de CLI" para isso: e uma acao na interface.
Conceitos-chave
Onde se escolhe local ou nuvem, na UI.
O do Ollama (qwen3-coder-64k), nao da nuvem.
Onde o modelo ativo e exibido.
Conectar e clicar, nao digitar comando.
๐ A exigencia dos 64k
Agora fica claro por que fizemos o trabalho do modulo 2.4. O Hermes precisa de uma janela grande para caber o sistema do agente โ instrucoes, memoria, descricoes de ferramentas e o historico da conversa. Se voce apontar um modelo de contexto curto, o agente trava ou esquece coisas no meio do caminho.
Tudo o que o agente precisa lembrar (instrucoes, ferramentas, memoria e conversa) divide a mesma janela. Com 64k, sobra espaco; com contexto curto, a janela lota e o agente perde o fio โ exatamente o problema que o qwen3-coder-64k resolve.
๐ก Dica pratica
Se o agente comecar a ignorar instrucoes ou "se perder" no meio de uma tarefa, suspeite do contexto. Confirme que o modelo selecionado e o de 64k (e nao o de chat) olhando o canto inferior direito.
Conceitos-chave
Instrucoes + ferramentas que ocupam contexto.
Contexto curto enche e o agente esquece.
O modelo 64k existe para alimentar o Hermes.
Selecionar o de chat trava o agente.
๐ฉบ Diagnostico quando algo nao bate
Se a conexao parecer estranha, o Hermes traz dois comandos de saude. O hermes status mostra o estado geral; o hermes doctor faz uma checagem mais funda e aponta problemas comuns. Sao os primeiros lugares para olhar antes de mexer em qualquer outra coisa.
๐ฏ Objetivo
Conferir o estado do Hermes e rodar um diagnostico quando a conexao do modelo nao parecer correta.
hermes status
hermes doctor
Como verificar: hermes status resume o estado atual; hermes doctor lista checagens e sinaliza o que estiver fora do lugar. Se ele apontar algo (ex.: Ollama nao acessivel), resolva isso primeiro e rode de novo.
โ Antes de pedir ajuda
- โO Ollama esta rodando? (
ollama listresponde) - โO modelo 64k aparece em
ollama list? - โO canto inferior direito mostra o modelo local?
- โ
hermes doctorsem alertas vermelhos?
โ Armadilhas comuns
- โOllama fechado: o Hermes nao acha o modelo.
- โSelecionou o modelo de chat, nao o de 64k.
- โRAM no limite: o modelo nem carrega.
- โEsqueceu o
hermes updatee esta numa versao velha.
Conceitos-chave
Resumo do estado do agente.
Checagem profunda; aponta problemas.
Pre-requisito: o servico precisa estar de pe.
Corrigir o alerta e rodar o doctor de novo.
โ Teste a conexao (100% local)
O teste final e simples: com o modelo local selecionado, mande um "oi" ao agente. Se ele responder, voce tem um agente rodando inteiramente na sua maquina. A prova de privacidade vem a seguir: desconecte a internet e mande outra mensagem โ se continuar respondendo, nada estava saindo para a nuvem.
Mande um "oi"
Com o qwen3-coder-64k ativo, escreva uma mensagem simples e veja a resposta chegar.
Desconecte a internet
Desligue o wi-fi (ou tire o cabo). E o teste do "modo Vault" que veremos na Trilha 3.
Mande outra mensagem
Se o agente ainda responde sem rede, esta provado: tudo roda local, nada vazou.
๐ O que voce acabou de montar
Um agente completo โ Hermes + Ollama + qwen3-coder-64k โ raciocinando 100% na sua maquina, de graca e sem internet. Esse e o coracao do curso. Na Trilha 3 voce vai usar essa base em projetos reais.
Conceitos-chave
A forma mais rapida de validar a conexao.
Sem rede e ainda responde = prova de local.
Desconectar e a base do modo airgapped.
Hermes + Ollama + modelo 64k juntos.
Auto-checagem (opcional): qual a melhor prova de que o agente roda 100% local?
๐ฏ Resumo do modulo
Proximo modulo:
2.6 โ App desktop, terminal e Telegram