📥 /queue — enfileira sem interromper
O /queue (tecla Q) enfileira um prompt para o próximo turno, sem interromper o que o agente está fazendo agora. Você adianta o próximo passo enquanto ele ainda trabalha no atual — fluxo contínuo, sem esperar parado.
Uso do /queue (ilustrativo)
› hermes: gerando relatório… (em andamento) você: /queue "depois, manda por email pro time" › hermes: ok, enfileirado pro próximo turno.
💡 Quando usar
Quando você já sabe o próximo passo e não quer esperar o atual terminar para digitá-lo. Mantém o ritmo da sessão.
🔀 /background — paralelo no mesmo chat
O /background roda tarefas em paralelo no mesmo chat: múltiplos fluxos concorrentes ao mesmo tempo. Diferente do /queue (que é sequencial, "depois"), o /background é simultâneo ("ao mesmo tempo").
📥 /queue
Sequencial. "Faça isso depois daquilo." Um por vez, em ordem.
🔀 /background
Paralelo. "Faça isso E aquilo ao mesmo tempo." Vários fluxos concorrentes.
📊 Exemplo de paralelismo
"/background pesquisa concorrentes E resume meus emails E gera um rascunho" — três tarefas rodando juntas, sem abrir três janelas.
🗂️ /canban e /reset
Dois comandos de organização: /canban abre um quadro de tarefas (visualiza o que está em andamento, pendente, feito); /reset limpa tudo e começa do zero. Recomeçar limpo é uma das alavancas de performance mais subestimadas.
🗂️ /canban
Quadro de tarefas: organiza o que o agente está fazendo em colunas, estilo kanban.
🔄 /reset
Limpa tudo: zera o contexto da sessão para recomeçar leve e rápido.
💡 Dica prática
Terminou um assunto? /reset antes do próximo. Carregar contexto velho de uma tarefa que acabou só piora a performance e o custo da próxima.
🗜️ /compress — comprime o contexto
O /compress comprime a memória/contexto da conversa: na prática, "resuma tudo que falamos" — transforma uma conversa grande num resumo enxuto e continua dali. É como o /reset, mas sem perder o essencial.
📊 /compress × /reset
- /reset → apaga tudo (recomeço total)
- /compress → resume e mantém o essencial (recomeço leve)
🧠 /model — troca o cérebro
O /model troca o modelo que está pensando — o "cérebro" do Hermes. É a base da estratégia multi-brain (Trilha 1): use o melhor modelo para cada tarefa, sem ficar preso a um único.
Trocando de modelo (ilustrativo)
você: /model opus-4-8 # raciocínio difícil você: /model gpt # volume, usando sua assinatura você: /model deepseek # quase de graça
💡 Dica prática
Troque o modelo conforme a tarefa muda dentro da mesma sessão: forte para planejar, barato para executar o volume. "Para um martelo, tudo é prego."
🪟 A janela de contexto — uma sessão, uma janela
O conceito que amarra tudo: cada pergunta usa TODO o contexto + a pergunta. Quanto maior o contexto, pior a performance e maior o custo. Por isso o ideal é "uma sessão, uma janela": foque um assunto, e depois resete ou comprima.
Abra uma sessão por assunto
Comece limpo, focado em um objetivo. Contexto pequeno = respostas melhores e mais baratas.
Comprima quando crescer
Sessão ficou longa mas ainda útil? /compress resume e mantém o essencial.
Resete ao mudar de assunto
Tópico novo e sem relação? /reset e comece outra janela limpa.
✗ Contexto inchado
- ✗Uma sessão eterna com 10 assuntos
- ✗Performance cai a cada turno
- ✗Custo sobe (todo o contexto é reenviado)
✓ Janela enxuta
- ✓Um assunto por sessão
- ✓/compress quando ficar grande
- ✓/reset ao mudar de assunto
📊 Por que isso fecha a Trilha 2
As 6 teclas existem para gerir a janela de contexto: queue e background organizam o fluxo, canban visualiza, reset e compress controlam o tamanho, e model escolhe o cérebro. Budget e tokens são aprofundados na Trilha 3.
📌 Resumo do Módulo
Próxima Trilha:
Trilha 3 — Poder & Operação: segurança, goals, sub-agentes, heartbeat, budget e o operating system