๐ Projeto 6: Alternar Vault, Connected e Cloud
Voce ja sabe rodar tudo no Vault (3.2) e deixar agentes 24/7 a $0 (3.5). Agora o pulo do gato: rotear cada tarefa para o modo certo pela sensibilidade do dado. Neste projeto voce monta uma regra de decisao simples โ privado, equilibrio ou qualidade โ e aprende a pedir a troca no meio da conversa. O resultado e um fluxo hibrido que e privado quando precisa e potente quando pode.
๐ฏ Objetivo: roteirizar por sensibilidade
O objetivo deste projeto e simples de dizer e poderoso na pratica: para cada tarefa que voce manda ao agente, escolher de forma consciente onde ela roda โ Vault, Connected ou Cloud โ usando a sensibilidade do dado como criterio. No fim voce vai ter uma regra de bolso e a fluencia de trocar de modo no meio da conversa, sem fricao.
๐งญ O que voce vai entregar
- โขUma regra de decisao escrita: "se o dado e X, uso o modo Y".
- โข3 tarefas reais classificadas โ uma por modo โ para treinar o olho.
- โขA frase pronta para pedir a troca no meio do chat ("manda esse pro privado").
Lembrete dos modos (do 1.6): Vault = tudo local, cabo de internet "desconectado" (airgapped). Connected = modelo local + um "private pipe" para buscar na web quando necessario. Cloud = liga a nuvem e usa um modelo de fronteira quando a qualidade vale o trade-off de privacidade.
Conceitos-chave
Mandar cada tarefa para o modo certo, em vez de um modo fixo.
O criterio: quanto o dado nao pode vazar define o modo.
Privado quando precisa, potente quando pode โ no mesmo agente.
Uma decisao rapida, sem precisar pensar do zero toda vez.
๐๏ธ Vault para dado sensivel
A primeira regra e a mais importante: na duvida, Vault. Se o dado pode te causar problema legal, contratual ou de confianca caso vaze, ele nao sai da maquina โ ponto. No Hermes, isso e ligar o modo Vault (airgapped) com o seu modelo local selecionado (o qwen3-coder-64k que voce criou no 2.4).
โ Mande para o Vault quando
- โDados de cliente, financas ou contratos.
- โNotas de saude ou qualquer informacao regulada.
- โCodigo proprietario / segredo de negocio.
- โVoce esta offline (aviao, off-grid) e precisa trabalhar.
โ Como ligar o Vault (acao na UI)
- 1Selecione o modelo local no canto inferior direito.
- 2Acione o modo Vault (airgapped) no agente.
- 3Confirme que nenhuma busca web esta habilitada.
- 4Agora a tarefa roda 100% na sua maquina.
โ ๏ธ O erro caro
Mandar dado sensivel para a Cloud "por preguica" ou porque a resposta vem mais bonita. Isso pode violar contrato (NDA), lei (GDPR) ou simplesmente queimar a confianca de um cliente. O custo de uma resposta um pouco pior no Vault e quase sempre menor que o de um vazamento.
Conceitos-chave
Sem ponte com a internet โ o dado nao tem por onde sair.
O default seguro quando a classificacao nao e obvia.
Saude, financas, dados pessoais โ mandar pra fora pode ser ilegal.
Quase sempre maior que o ganho de uma resposta melhor.
๐ Connected para equilibrio
O modo Connected e o meio-termo elegante: o raciocinio continua no seu modelo local, mas o agente abre um "private pipe" para buscar na web quando a tarefa precisa de informacao fresca. Voce ganha atualidade sem entregar a inteligencia inteira para a nuvem โ o pensamento fica em casa, so a consulta sai.
๐ Quando o Connected brilha
- โขPesquisa atual: "qual a versao mais recente da lib X?" โ precisa olhar a web.
- โขDado nao-sensivel: a pergunta nao expoe nada confidencial.
- โขQuer velocidade + alcance: resposta local rapida, complementada por busca.
Novo aqui? "Private pipe" (cano privado) e o canal controlado que o agente usa para consultar a web sem despejar a sua conversa inteira la fora. Pense numa janelinha estreita: passa a consulta, volta o resultado, e o resto da conversa nunca atravessa.
Conceitos-chave
Cano estreito de busca; o pensamento fica local.
Quando o modelo precisa de algo recente que nao "sabe".
Privacidade alta + alcance da web, sem ir all-in na nuvem.
A consulta nao revela nada que precise ficar trancado.
โ๏ธ Cloud para qualidade
Tem tarefa em que voce simplesmente quer a melhor resposta possivel e o dado nao e sensivel โ um problema cabeludo de arquitetura, um texto que precisa brilhar, um raciocinio longo. Para isso existe o modo Cloud: ligar a nuvem e usar um modelo de fronteira. Lembre do trade-off da Trilha 1 โ o local fica ~1 ano atras da fronteira, entao em tarefas dificeis a Cloud ainda ganha.
Leia de cima pra baixo: sensivel? โ Vault (e fim da linha, sem brecha). Se nao, precisa de web? โ Connected. Se nem isso e voce quer a melhor resposta, Cloud. O ramo "sensivel" NUNCA leva a Cloud โ essa e a regra que protege voce.
๐ก Dica pratica
Antes de mandar uma tarefa pra Cloud, faca um teste mental: "se esse texto aparecesse num print publico, eu me importaria?". Se a resposta for sim, volte para o Vault. Se for nao, a Cloud e justa.
Conceitos-chave
O estado da arte na nuvem; vence em tarefas dificeis.
O local fica ~1 ano atras; por isso a Cloud para o "top".
Se te incomodaria vazar, nao vai pra Cloud.
A unica situacao em que a Cloud e a escolha certa.
๐ฃ๏ธ Pedir a troca no meio da conversa
A parte mais fluida do Hermes: voce nao precisa abrir menus para mudar de modo. Da pra pedir a troca em linguagem natural, no meio do chat. Comecou uma pergunta geral na Cloud, percebeu que vai colar um trecho confidencial? E so dizer "manda esse proximo pro privado" e seguir.
Comece onde fizer sentido
Pergunta geral? Pode comecar na Connected ou Cloud. Veja o modo ativo no canto inferior direito.
Sinalize antes de colar o sensivel
Peca a troca ANTES de colar o dado confidencial โ nao depois. A ordem importa.
Confirme no indicador
Olhe o canto inferior direito: o modelo/modo ativo deve refletir o Vault antes de voce enviar o dado.
Frases prontas para pedir a troca
manda <essa proxima tarefa> pro privado (Vault), vou colar dado de cliente
agora pode voltar pro modo conectado pra buscar <a versao da lib> na web
esse problema e dificil e nao tem nada sensivel โ usa a nuvem (Cloud) pra essa
Troque o que esta em <...> pelo seu caso. Verificar: depois do pedido, o indicador de modo (canto inferior direito) muda para o modo solicitado antes de voce enviar o conteudo.
Honestidade: a frase exata e livre โ o agente entende a intencao. O que e fixo e a UI: o modo/modelo ativo aparece no canto inferior direito e ha os modos Vault / Connected / Cloud. Sempre confirme nesse indicador antes de mandar algo sensivel; nao confie so na frase.
Conceitos-chave
Pedir o modo no chat, sem abrir menu.
Trocar ANTES de colar o dado, nunca depois.
Canto inferior direito mostra o modo/modelo ativo.
Confirme no indicador, nao so na frase digitada.
โ Resultado: o fluxo hibrido
No fim deste projeto voce tem um fluxo hibrido funcionando: o mesmo agente atende dado de cliente no Vault, pesquisa atual no Connected e o problema cabeludo na Cloud โ e voce desliza entre eles sem perder o ritmo. A privacidade deixou de ser "tudo ou nada" e virou uma escolha por tarefa.
โ Como verificar que deu certo
- โVoce classifica 3 tarefas reais sem hesitar (uma por modo).
- โConsegue pedir a troca no chat e ver o indicador mudar.
- โNenhum dado sensivel passou pela Cloud em nenhum teste.
- โEm offline, o Vault continua respondendo normalmente.
โ Sinais de que falhou
- โVoce so usa um modo fixo "pra nao pensar".
- โColou o dado e SO depois lembrou de trocar de modo.
- โNao confere o indicador antes de enviar o sensivel.
- โManda tudo pra Cloud porque "a resposta e melhor".
๐งฉ A regra em uma frase
"Sensivel โ Vault. Precisa de web e nao e sensivel โ Connected. Quer o melhor e nao e sensivel โ Cloud." Decore isso e voce nunca mais decide no escuro.
Auto-checagem (opcional): voce vai pedir ao agente para revisar o contrato de um cliente (NDA assinado). Qual modo?
๐ฏ Resumo do projeto
Proximo modulo:
3.7 โ Projeto 7: Hermes no celular de qualquer lugar (e o encerramento do curso)