Mapa da trilha
🕹️ Human-in-the-loop × AFK
Saia do loop
📦 Paralelizar & sandboxes
Agentes isolados
⚙️ GitHub Actions + agentes
AFK na nuvem
🧮 Loops × Filas
Fila, não loop
♻️ Sistemas auto-melhoráveis
Compre o cadeado
🎬 Checkpoints & review fluido
Review sem dor
Conteúdo detalhado
🕹️ Human-in-the-loop × AFK
Saia do loop: pare de aprovar cada passo e deixe o agente rodar sozinho (AFK).
O modo padrão: você aprova cada passo e cada ação do agente.
É seguro, mas vira gargalo — você é o limite de velocidade.
Aprovação manual; segurança × throughput.
Deixar o agente rodar sozinho enquanto você está longe do teclado.
É o salto de produtividade: o trabalho acontece sem você.
AFK = agente autônomo; sem babá.
O momento em que você confia o suficiente no harness para sair do loop.
Destrava paralelismo: vários agentes trabalhando ao mesmo tempo.
Confiança no harness → autonomia.
Tarefas arriscadas ou ambíguas ainda pedem você no loop.
AFK cego em tarefa errada é como dar a chave do carro a um júnior.
Risco × reversibilidade decide o modo.
Configurar permissões para o agente agir sem pedir aprovação a cada passo.
Cada confirmação manual é fricção que mata o AFK.
Allowlist; auto-approve com limites.
AFK + paralelismo = vários "vocês" trabalhando em frentes diferentes.
É a alavanca de escala real do método.
Frota de agentes; você como gerente.
📦 Paralelizar & sandboxes
Agentes isolados: rode vários em paralelo sem que um quebre o ambiente do outro.
Rodar várias tarefas com agentes diferentes ao mesmo tempo.
Multiplica throughput sem multiplicar o seu tempo.
Paralelismo = vazão; você vira orquestrador.
Agente AFK com acesso total à sua máquina pode causar estrago.
AFK sem isolamento é a receita do desastre.
Blast radius; isolar antes de soltar.
A ferramenta de sandbox que o Matt usa para rodar agentes isolados.
É o atalho prático para AFK seguro.
Sandbox pronta; isolamento por tarefa.
Containers como caixa de areia para cada agente.
Isolamento padrão da indústria, fácil de descartar e recriar.
Container efêmero; ambiente reproduzível.
Sandboxes gerenciadas na nuvem para rodar agentes sem sua máquina.
Tira o agente do seu laptop e libera você totalmente.
Sandbox como serviço; sem travar o local.
Coordenar uma frota de agentes em sandboxes separadas.
É onde paralelismo + isolamento viram escala de verdade.
Frota isolada; cada um na sua caixa.
⚙️ GitHub Actions + agentes
AFK na nuvem: agentes que rodam no CI, abrem PRs e nunca travam sua máquina.
Rodar agentes dentro do GitHub Actions, como um passo do CI.
CI é um sandbox AFK gratuito que você já tem.
Agente como job; ambiente efêmero.
Uma Action que revisa cada PR com um agente automaticamente.
Review consistente em todo PR, sem você lembrar de pedir.
Review on push; feedback no PR.
Aplicar uma label numa issue/PR dispara o agente para agir.
Vira um botão "manda o agente" dentro do GitHub.
Trigger por label; on demand.
O agente entrega o trabalho como um PR pronto para você revisar.
PR é o checkpoint natural entre AFK e revisão humana.
Saída revisável; nada vai direto pra main.
Todo o trabalho roda nos runners do GitHub, não no seu laptop.
Você fica livre enquanto o agente trabalha na nuvem.
Compute remoto; laptop liberado.
Montar sua própria Action de agente do zero (detalhada na Trilha 5).
Uma Action sua se adapta exatamente ao seu fluxo.
YAML mínimo; checkout → agente → PR.
🧮 Loops × Filas
Fila, não loop: por que uma fila de tarefas vence o loop infinito do agente.
O "Ralph loop" de Geoff Huntley: rodar o agente em loop até resolver.
É o ponto de partida — e onde muita gente trava.
Loop bruto; repete até "pronto".
Loop cego repete sem priorizar nem escopar — desperdiça tokens.
Repetir não é o mesmo que organizar o trabalho.
Loop sem triagem = caro e errático.
Em vez de um loop, uma fila de tarefas escopadas que o agente consome.
Fila dá ordem, prioridade e parada limpa.
Queue de tarefas; consumir em ordem.
Quebrar e priorizar tarefas com escopo nítido antes de enfileirar.
Tarefa bem escopada é tarefa que o agente termina sozinho.
Triagem; escopo nítido por item.
Você é o rei que distribui ordens; os agentes são os súditos que executam.
Fixa a mentalidade: você comanda, não executa.
Rei distribui; súditos executam a fila.
Vários agentes (nós) puxando da mesma fila em paralelo.
Junta fila + paralelismo para máxima vazão.
Workers puxando da fila; escala horizontal.
♻️ Sistemas auto-melhoráveis
Compre o cadeado: sistemas que detectam problemas e se consertam sozinhos.
Um sistema bem feito não exige o modelo mais caro para se sustentar.
"Compre o cadeado": invista no sistema, não na peça cara.
Sistema barato e robusto > modelo premium.
Um cron que roda um agente de security review periodicamente.
Segurança vira rotina automática, não um esforço pontual.
Cron diário; varredura recorrente.
Telemetria detecta o problema, abre uma issue e dispara o fix.
Fecha o ciclo da observação ao conserto sem você no meio.
Detectar → abrir issue → corrigir.
O agente busca a causa raiz, não só o sintoma do bug.
Causa raiz evita que o mesmo problema volte.
Root cause > band-aid.
O sistema aprende com cada falha e ajusta a si mesmo.
Auto-melhoria compõe: o sistema fica melhor sozinho ao longo do tempo.
Feedback loop; melhora composta.
Revisar periodicamente o próprio sistema auto-melhorável.
Auto-melhoria sem supervisão pode derivar para o lugar errado.
Auditar o auto-ajuste; humano no nível de cima.
🎬 Checkpoints & review fluido
Review sem dor: empurre o checkpoint pra direita e revise o agente sem fricção.
O review é o ponto onde você verifica e corrige o rumo do agente.
É a sua rede de segurança no mundo AFK.
Checkpoint = controle de qualidade.
Adiar o ponto de revisão para o fim, dando mais autonomia ao agente.
Quanto mais à direita o checkpoint, mais AFK você consegue.
Mover o checkpoint conforme a confiança sobe.
Identificar os checkpoints onde o humano já não agrega valor.
Remover o humano certo acelera; remover o errado quebra.
Cortar o checkpoint redundante, manter o crítico.
Usar um agente para revisar o trabalho de outro antes de você.
Filtra a maioria dos erros antes do checkpoint humano.
Agente revisor; dupla checagem.
O agente grava um walkthrough em vídeo com narração TTS do que fez.
Você revisa assistindo, em vez de ler diff por diff.
Walkthrough narrado; review por vídeo.
Usar IA para resumir, destacar e acelerar o seu review humano.
Review rápido mantém o AFK fluindo sem virar gargalo.
IA resume o diff; review sem dor.