Mapa da trilha
Conteúdo detalhado
🔄 Pare de promptar, projete loops
A virada do nível avançado: deixar de operar o agente e passar a desenhar o sistema que o opera.
Steinberger: "não prompte seus agentes — projete loops que promptam seus agentes". O operador sai, o sistema entra.
É o pré-requisito mental de toda a trilha; sem ele, frota e guardrail viram só jargão.
Loop que prompta o agente; a citação do Cherny (via terceiros).
Você se substitui como a pessoa que prompta: projeta o SISTEMA que faz isso, em vez de digitar cada volta.
Tira você do gargalo; seu tempo entra no design, não em cada iteração.
Loop engineering; operador × arquiteto.
Um agente que INFERE os loops que você quereria (pelo seu "vibe") e os escreve. O degrau mais alto da escada de abstração.
Sedutor e arriscado: abstração ganha escala e perde visibilidade.
Meta-agente; escada da abstração.
Osmani: um loop é um objetivo recursivo — você define um propósito e a IA itera até completar.
Todo loop sólido tem 2 pilares: o objetivo (o quê) e a verificação (como ela sabe que parou).
Objetivo recursivo; objetivo + verificação.
Para rodar através de várias janelas de contexto, externalize o estado: git + arquivos de progresso (harness da Anthropic).
Cada sessão: lê o estado, faz 1 feature, self-verify, commita, deixa limpo. O disco vira a memória longa.
Context window; estado externalizado; 1 feature por sessão.
Nate Herk: o Steinberger fazer isso não significa que se aplica a você. Há loops por cadência, por evento e 24/7.
Nem todo mundo precisa de 24/7 — copiar a frota por status é erro, não engenharia.
Cadência × evento × 24-7; ferramenta certa pro seu caso.
🧱 Padrões avançados
O kit de padrões da frota: Ralph loop, loops agendados, worktrees, guardrails, verificação adversarial, fan-out e memória.
Huntley/HumanLayer: um loop de shell infinito que repete o mesmo prompt; cada volta muta o código, que vira o estado inicial da próxima.
Potente e perigoso: "bizarre emergent behavior" se rodar demais. Combine sempre com guardrails.
Ralph loop; o one-liner while :; do ...; done.
Lewis (relatado): um job que o agente repete — acorda num schedule/evento, lê o estado, faz 1 job escopado, grava, dorme.
Manager classifica o backlog; worker implementa e abre PRs; control plane de Issues; humano aprova o merge.
Split manager/worker; control plane; permissões fixas.
Worktree isola o trabalho paralelo; sandbox isola o ambiente; permissões fixas isolam o que o agente PODE fazer.
Permissões fixas são como você deixa um loop rodar sem fazer algo irreversível.
Git worktree; sandbox; permissões fixas.
Consenso grassroots: "os guardrails são o trabalho de verdade, não os agentes". O worker abre PR mas nunca dá merge; humano aprova.
O agente é a parte fácil; o difícil é desenhar os limites que o cercam.
Guardrails; prompt de permissões; porta final humana.
Um 2º agente (ou painel) que tenta QUEBRAR o trabalho, prompted para refutar. Só aprova quando não consegue.
Quem faz nunca dá a própria nota — verificação levada ao ataque.
Verification specialist (especulação, não fato); refutação.
Manager promptando agentes que promptam agentes ("Russian nesting dolls"). O padrão: orquestrar → delegar → verificar.
Fan-out (A→N) dá velocidade; a verificação (N→1) impede N erros virarem um produto quebrado.
Fan-out; orquestração; A → N → 1.
O loop atravessa episódios: agir → feedback → refletir em texto → guardar na memória episódica → tentar melhor na próxima.
Aprende por linguagem, não por re-treino. Um worker que guarda o aprendido melhora a cada ticket.
Cross-trial memory; Reflexion; memória episódica.
🛰️ Riscos, custo e estudo de caso
O fecho do curso: os perigos reais do loop autônomo, e como este próprio curso foi auditado por um loop maker/checker.
Osmani: entregar o controle total ao loop e parar de ler a saída. Você continua o revisor, sobretudo no começo.
O loop não sente quando deriva; você é o sensor que faltou.
Cognitive surrender; delegar com revisão × render-se.
Firecrawl alerta custo e "dívida de compreensão". Sullivan rejeita "tokenmaxxing" e também o "promptchud".
O meio-termo: agentes que reproduzem problemas reais do seu produto.
Comprehension debt; tokenmaxxing; promptchud.
Nate: já teve loops de 12h+ que não eram úteis. O útil costuma ser ~35 min a poucas horas.
Um "chunky loop antes de dormir" (4–8h) pode render; mas não precisa de um loop de 4 dias.
Régua de duração; chunky loop noturno; deriva.
A IA nunca acerta de primeira; terceirizar o ciclo de feedback-e-iteração para a IA faz a qualidade subir muito mais cedo.
É o motivo de pagar o preço dos riscos: a curva chega a "bom o bastante" antes.
Linha humano (lenta) × linha loop (rápida) até 90–95%.
Este curso saiu de um loop maker/checker: DISCOVER → EXTRACT (maker) → VERIFY (checker separado e adversarial) → SYNTHESIZE.
O modelo que ACHA a fonte nunca a AVALIA — a separação de papéis é o que dá confiança.
Pipeline discover→extract→verify→synthesize.
Thumbnails (rubrica + scorer), avião 3JS (render no browser, ~37 min), Abbey Road em CSS (nota ≥9 ou cap 8, parou no V7), edição de vídeo (beats alinhados).
Em todos, o gargalo é o mesmo: fazer a verificação ser objetiva o bastante para saber quando parar.
Condição de parada concreta; scorer dedicado; cap de passes.
Em loop: tarefas repetitivas, revisáveis, de alto valor, com checker embutido. Para o resto, prompte uma vez.
Rode loops na cadência certa pro SEU caso — não 24/7 por status. A frase do curso: loop só com verificação.
"Faça isto / Pule isto"; loop só com verificação.