Pular para o conteúdo
TRILHA 4

🛰️ Técnicas Avançadas

Sair do human-in-the-loop e construir sistemas que rodam sozinhos e se auto-melhoram. AFK, sandboxes, GitHub Actions, filas de tarefas e loops de auto-melhoria — o harness que trabalha por você enquanto você não está.

Ilustração da trilha 4: Técnicas Avançadas fila de tarefas sandboxes GitHub Actions telemetria AFK o sistema roda sozinho Auto-melhora
6
Módulos
36
Tópicos
~3h
Duração
Avançado
Nível
Progresso da trilha: 0% 0 de 36

Mapa da trilha

Conteúdo detalhado

4.1~30 min

🕹️ Human-in-the-loop × AFK

Saia do loop: pare de aprovar cada passo e deixe o agente rodar sozinho (AFK).

O que é:

O modo padrão: você aprova cada passo e cada ação do agente.

Por que aprender:

É seguro, mas vira gargalo — você é o limite de velocidade.

Conceitos-chave:

Aprovação manual; segurança × throughput.

O que é:

Deixar o agente rodar sozinho enquanto você está longe do teclado.

Por que aprender:

É o salto de produtividade: o trabalho acontece sem você.

Conceitos-chave:

AFK = agente autônomo; sem babá.

O que é:

O momento em que você confia o suficiente no harness para sair do loop.

Por que aprender:

Destrava paralelismo: vários agentes trabalhando ao mesmo tempo.

Conceitos-chave:

Confiança no harness → autonomia.

O que é:

Tarefas arriscadas ou ambíguas ainda pedem você no loop.

Por que aprender:

AFK cego em tarefa errada é como dar a chave do carro a um júnior.

Conceitos-chave:

Risco × reversibilidade decide o modo.

O que é:

Configurar permissões para o agente agir sem pedir aprovação a cada passo.

Por que aprender:

Cada confirmação manual é fricção que mata o AFK.

Conceitos-chave:

Allowlist; auto-approve com limites.

O que é:

AFK + paralelismo = vários "vocês" trabalhando em frentes diferentes.

Por que aprender:

É a alavanca de escala real do método.

Conceitos-chave:

Frota de agentes; você como gerente.

Ver Completo
4.2~30 min

📦 Paralelizar & sandboxes

Agentes isolados: rode vários em paralelo sem que um quebre o ambiente do outro.

O que é:

Rodar várias tarefas com agentes diferentes ao mesmo tempo.

Por que aprender:

Multiplica throughput sem multiplicar o seu tempo.

Conceitos-chave:

Paralelismo = vazão; você vira orquestrador.

O que é:

Agente AFK com acesso total à sua máquina pode causar estrago.

Por que aprender:

AFK sem isolamento é a receita do desastre.

Conceitos-chave:

Blast radius; isolar antes de soltar.

O que é:

A ferramenta de sandbox que o Matt usa para rodar agentes isolados.

Por que aprender:

É o atalho prático para AFK seguro.

Conceitos-chave:

Sandbox pronta; isolamento por tarefa.

O que é:

Containers como caixa de areia para cada agente.

Por que aprender:

Isolamento padrão da indústria, fácil de descartar e recriar.

Conceitos-chave:

Container efêmero; ambiente reproduzível.

O que é:

Sandboxes gerenciadas na nuvem para rodar agentes sem sua máquina.

Por que aprender:

Tira o agente do seu laptop e libera você totalmente.

Conceitos-chave:

Sandbox como serviço; sem travar o local.

O que é:

Coordenar uma frota de agentes em sandboxes separadas.

Por que aprender:

É onde paralelismo + isolamento viram escala de verdade.

Conceitos-chave:

Frota isolada; cada um na sua caixa.

Ver Completo
4.3~30 min

⚙️ GitHub Actions + agentes

AFK na nuvem: agentes que rodam no CI, abrem PRs e nunca travam sua máquina.

O que é:

Rodar agentes dentro do GitHub Actions, como um passo do CI.

Por que aprender:

CI é um sandbox AFK gratuito que você já tem.

Conceitos-chave:

Agente como job; ambiente efêmero.

O que é:

Uma Action que revisa cada PR com um agente automaticamente.

Por que aprender:

Review consistente em todo PR, sem você lembrar de pedir.

Conceitos-chave:

Review on push; feedback no PR.

O que é:

Aplicar uma label numa issue/PR dispara o agente para agir.

Por que aprender:

Vira um botão "manda o agente" dentro do GitHub.

Conceitos-chave:

Trigger por label; on demand.

O que é:

O agente entrega o trabalho como um PR pronto para você revisar.

Por que aprender:

PR é o checkpoint natural entre AFK e revisão humana.

Conceitos-chave:

Saída revisável; nada vai direto pra main.

O que é:

Todo o trabalho roda nos runners do GitHub, não no seu laptop.

Por que aprender:

Você fica livre enquanto o agente trabalha na nuvem.

Conceitos-chave:

Compute remoto; laptop liberado.

O que é:

Montar sua própria Action de agente do zero (detalhada na Trilha 5).

Por que aprender:

Uma Action sua se adapta exatamente ao seu fluxo.

Conceitos-chave:

YAML mínimo; checkout → agente → PR.

Ver Completo
4.4~30 min

🧮 Loops × Filas

Fila, não loop: por que uma fila de tarefas vence o loop infinito do agente.

O que é:

O "Ralph loop" de Geoff Huntley: rodar o agente em loop até resolver.

Por que aprender:

É o ponto de partida — e onde muita gente trava.

Conceitos-chave:

Loop bruto; repete até "pronto".

O que é:

Loop cego repete sem priorizar nem escopar — desperdiça tokens.

Por que aprender:

Repetir não é o mesmo que organizar o trabalho.

Conceitos-chave:

Loop sem triagem = caro e errático.

O que é:

Em vez de um loop, uma fila de tarefas escopadas que o agente consome.

Por que aprender:

Fila dá ordem, prioridade e parada limpa.

Conceitos-chave:

Queue de tarefas; consumir em ordem.

O que é:

Quebrar e priorizar tarefas com escopo nítido antes de enfileirar.

Por que aprender:

Tarefa bem escopada é tarefa que o agente termina sozinho.

Conceitos-chave:

Triagem; escopo nítido por item.

O que é:

Você é o rei que distribui ordens; os agentes são os súditos que executam.

Por que aprender:

Fixa a mentalidade: você comanda, não executa.

Conceitos-chave:

Rei distribui; súditos executam a fila.

O que é:

Vários agentes (nós) puxando da mesma fila em paralelo.

Por que aprender:

Junta fila + paralelismo para máxima vazão.

Conceitos-chave:

Workers puxando da fila; escala horizontal.

Ver Completo
4.5~30 min

♻️ Sistemas auto-melhoráveis

Compre o cadeado: sistemas que detectam problemas e se consertam sozinhos.

O que é:

Um sistema bem feito não exige o modelo mais caro para se sustentar.

Por que aprender:

"Compre o cadeado": invista no sistema, não na peça cara.

Conceitos-chave:

Sistema barato e robusto > modelo premium.

O que é:

Um cron que roda um agente de security review periodicamente.

Por que aprender:

Segurança vira rotina automática, não um esforço pontual.

Conceitos-chave:

Cron diário; varredura recorrente.

O que é:

Telemetria detecta o problema, abre uma issue e dispara o fix.

Por que aprender:

Fecha o ciclo da observação ao conserto sem você no meio.

Conceitos-chave:

Detectar → abrir issue → corrigir.

O que é:

O agente busca a causa raiz, não só o sintoma do bug.

Por que aprender:

Causa raiz evita que o mesmo problema volte.

Conceitos-chave:

Root cause > band-aid.

O que é:

O sistema aprende com cada falha e ajusta a si mesmo.

Por que aprender:

Auto-melhoria compõe: o sistema fica melhor sozinho ao longo do tempo.

Conceitos-chave:

Feedback loop; melhora composta.

O que é:

Revisar periodicamente o próprio sistema auto-melhorável.

Por que aprender:

Auto-melhoria sem supervisão pode derivar para o lugar errado.

Conceitos-chave:

Auditar o auto-ajuste; humano no nível de cima.

Ver Completo
4.6~30 min

🎬 Checkpoints & review fluido

Review sem dor: empurre o checkpoint pra direita e revise o agente sem fricção.

O que é:

O review é o ponto onde você verifica e corrige o rumo do agente.

Por que aprender:

É a sua rede de segurança no mundo AFK.

Conceitos-chave:

Checkpoint = controle de qualidade.

O que é:

Adiar o ponto de revisão para o fim, dando mais autonomia ao agente.

Por que aprender:

Quanto mais à direita o checkpoint, mais AFK você consegue.

Conceitos-chave:

Mover o checkpoint conforme a confiança sobe.

O que é:

Identificar os checkpoints onde o humano já não agrega valor.

Por que aprender:

Remover o humano certo acelera; remover o errado quebra.

Conceitos-chave:

Cortar o checkpoint redundante, manter o crítico.

O que é:

Usar um agente para revisar o trabalho de outro antes de você.

Por que aprender:

Filtra a maioria dos erros antes do checkpoint humano.

Conceitos-chave:

Agente revisor; dupla checagem.

O que é:

O agente grava um walkthrough em vídeo com narração TTS do que fez.

Por que aprender:

Você revisa assistindo, em vez de ler diff por diff.

Conceitos-chave:

Walkthrough narrado; review por vídeo.

O que é:

Usar IA para resumir, destacar e acelerar o seu review humano.

Por que aprender:

Review rápido mantém o AFK fluindo sem virar gargalo.

Conceitos-chave:

IA resume o diff; review sem dor.

Ver Completo
← Trilha 3 Trilha 5 →