๐๏ธ Os tres modos: Vault, Connected e Cloud
A divisao por porcentagens do modulo anterior agora vira concreta. O Hermes resume todo o trade-off em tres modos com um toggle: Vault (tudo privado e local), Connected (o meio-termo) e Cloud (qualidade maxima). Neste modulo de fechamento da trilha voce aprende o que cada modo faz, quando usar cada um, e como alternar dinamicamente entre eles.
๐๏ธ Vault: privado, tudo local
O Vault e o modo do extremo da privacidade. Nele o agente fica airgapped โ como se voce tivesse arrancado o cabo de internet da parede. Tudo roda no seu modelo local: nada e enviado, nada e buscado fora, nada vaza. E o cofre: o que entra fica, e nada sai. Para dados que nao podem, em hipotese alguma, deixar a sua maquina, esse e o modo.
Novo aqui? "Airgapped" (com gap de ar) e um sistema sem nenhuma conexao com a internet ou outras redes โ fisicamente isolado. E o padrao-ouro de seguranca: se nao ha caminho de saida, o dado nao pode vazar. O modo Vault simula exatamente isso por software.
๐ O que o Vault garante
- โขZero trafego de rede โ funciona ate offline, num aviao ou bunker.
- โขSo o modelo local responde; nenhuma nuvem, nenhuma busca externa.
- โขPrivacidade por construcao, nao por promessa.
Conceitos-chave
O modo airgapped: tudo local, nada sai.
Sistema isolado, sem conexao com a internet.
O extremo do eixo: nada de saida possivel.
Sem rede, o Vault continua respondendo.
๐ Connected: performance, o meio-termo
O Connected e o equilibrio. O modelo continua sendo o seu modelo local, mas agora o agente ganha um "private pipe" (um cano privado) e a capacidade de fazer buscas. Em outras palavras: a inteligencia ainda e sua e roda na sua maquina, mas o agente pode ir buscar informacao fresca quando precisa โ sem entregar a tarefa inteira para a nuvem.
๐ O que muda do Vault para o Connected
- โขO modelo continua LOCAL โ o raciocinio nao sai da maquina.
- โขGanha um private pipe + busca โ o agente pode trazer dados atuais.
- โขMais util para tarefas que precisam de informacao do mundo, ainda com privacidade forte.
Novo aqui? "Private pipe" e um canal de saida controlado: o agente busca o que precisa por um caminho restrito, em vez de mandar tudo para a nuvem. Pense no Connected como "Vault com uma janelinha" โ a maior parte fica em casa, e so o estritamente necessario sai.
Conceitos-chave
Modelo local + private pipe + busca: o meio-termo.
Canal de saida controlado para buscar so o necessario.
O agente traz informacao fresca sem terceirizar o raciocinio.
Privacidade alta com utilidade maior que o Vault puro.
โ๏ธ Cloud: qualidade acima de privacidade
O Cloud e o extremo oposto do Vault. Aqui voce conscientemente liga a nuvem para usar um modelo de fronteira quando a qualidade da resposta importa mais do que manter o dado em casa. E o modo do "problema cabeludo": aquele 5% das tarefas onde voce quer o melhor cerebro disponivel, mesmo sabendo que o dado vai trafegar.
โ Quando o Cloud faz sentido
- โA tarefa exige a melhor resposta possivel.
- โO dado NAO e sensivel (publico ou ja exposto).
- โO problema esta fora do alcance do modelo local.
- โVoce escolheu DE PROPOSITO, sabendo do trade-off.
โ Quando NAO usar o Cloud
- โDados de cliente, saude ou IP proprietario.
- โPor preguica, quando o local ja resolveria.
- โEm ambiente regulado que proibe a saida do dado.
- โQuando voce quer custo $0 e offline.
Conceitos-chave
Liga a nuvem por qualidade; o extremo oposto do Vault.
O melhor cerebro disponivel, ao custo de privacidade.
Cloud e decisao deliberada, nao padrao.
A fatia de tarefas onde o ultimo ponto de qualidade pesa.
๐ฉบ Quando usar Vault: dados que nao podem sair
Vale uma regra clara para o caso mais critico. O Vault nao e luxo, e necessidade sempre que o dado nao pode, por lei ou contrato, deixar a sua maquina. Quando bater duvida, a pergunta e simples: "se isso vazasse, seria um problema serio?". Se a resposta for sim, Vault.
Dados de cliente
Informacao de terceiros que voce e responsavel por proteger โ Vault.
Saude e IP proprietario
Notas de saude, segredos de negocio, codigo confidencial โ Vault.
Sem internet
Aviao, area remota, rede caindo โ o Vault e o unico modo que sempre funciona.
โ ๏ธ O erro a evitar
Mandar dado sensivel para o Cloud "so dessa vez" porque era mais comodo. Em ambiente regulado isso pode ser ilegal โ e nao tem desfazer depois que o dado saiu. Na duvida sobre sensibilidade, o default seguro e o Vault.
Conceitos-chave
Na duvida sobre sensibilidade, comece pelo Vault.
Depois que o dado sai, nao tem como trazer de volta.
Ambientes regulados ficam simples quando o dado nao trafega.
"Se vazasse, seria grave?" Se sim, Vault.
๐ Alternar dinamicamente: "manda pro privado"
O poder real esta em trocar de modo na hora, conforme a tarefa muda. Voce nao escolhe um modo para sempre โ voce roteia cada pedido. No meio de uma conversa voce pode literalmente dizer algo como "manda esse pro privado" e o agente passa o trabalho para o Vault. O SVG abaixo e a arvore de decisao que voce vai usar.
A arvore: primeiro pergunte se o dado e sensivel (sim โ Vault). Se nao, pergunte se a tarefa exige a melhor resposta (sim โ Cloud; nao โ Connected). Esse e exatamente o roteamento que voce monta na pratica na Trilha 3.
Dica pratica: nao precisa decidir tudo no comeco. Comece em Connected (bom default), e quando bater dado sensivel, diga "manda pro privado" para cair no Vault; quando bater um problema dificil e nao-sensivel, suba para Cloud. O modo segue a tarefa, nao o contrario.
Conceitos-chave
Trocar de modo na hora, conforme a tarefa.
Comando em linguagem natural que joga o trabalho no Vault.
Sensivel? โ Vault. Melhor resposta? โ Cloud. Senao โ Connected.
Bom ponto de partida; ajusta para os extremos quando preciso.
๐ค Background agents 24/7 a $0
A consequencia mais poderosa de unir Vault (privacidade) com $0 por uso (preco): voce pode deixar agentes rodando o tempo todo. Como cada chamada e gratuita, nao ha medidor para te assustar โ um agente pode ficar de plantao 24 horas por dia, sete dias por semana, processando tarefas em background, sem nenhum susto na fatura.
โป๏ธ Por que so o local permite isso
- โขNa nuvem, um agente 24/7 acumularia uma fatura enorme por token.
- โขNo local, o custo marginal e ~$0 โ so energia e o hardware que ja e seu.
- โขE pode rodar em Vault: automacao constante E privada ao mesmo tempo.
๐งญ Para onde isso te leva
Voce fecha a Trilha 1 com o mapa mental completo: por que local, o vocabulario, o Ollama, contexto e parametros, o trade-off, e agora os tres modos. Na pratica, montar esses agentes 24/7 em Vault e tema de projeto la na Trilha 3 (Projeto 5). Antes disso, a Trilha 2 te poe a mao na massa: instalar, baixar modelos e conectar tudo ao Hermes.
Conceitos-chave
Agente que roda em segundo plano, sem voce no comando.
Plantao constante porque cada chamada local custa zero.
O proximo uso nao adiciona custo โ so energia.
Agente constante rodando em Vault, sem dado saindo.
Auto-checagem (opcional): voce vai mexer com dados de clientes (sensiveis) numa tarefa que o modelo local resolve bem. Qual modo?
๐ฏ Resumo do modulo e da Trilha 1
Voce concluiu a Trilha 1 โ Fundamentos! ๐
Agora voce tem o mapa mental completo: por que local, o vocabulario (LLM/agente/SO), o Ollama e os modelos abertos, contexto e parametros, o trade-off e os tres modos. A proxima trilha e mao na massa.