Trilha 4 · Loop Engineering

Mapa da trilha

4.1~45 min

🔄 Pare de promptar, projete loops

Você vira o arquiteto, não o operador

4.2~55 min

🧱 Padrões avançados

Ralph, frotas, guardrails, adversarial

4.3~55 min

🛰️ Riscos, custo e estudo de caso

O fecho: loop só com verificação

Conteúdo detalhado

4.1~45 min

🔄 Pare de promptar, projete loops

A virada do nível avançado: deixar de operar o agente e passar a desenhar o sistema que o opera.

O que é:

Steinberger: "não prompte seus agentes — projete loops que promptam seus agentes". O operador sai, o sistema entra.

Por que aprender:

É o pré-requisito mental de toda a trilha; sem ele, frota e guardrail viram só jargão.

Conceitos-chave:

Loop que prompta o agente; a citação do Cherny (via terceiros).

O que é:

Você se substitui como a pessoa que prompta: projeta o SISTEMA que faz isso, em vez de digitar cada volta.

Por que aprender:

Tira você do gargalo; seu tempo entra no design, não em cada iteração.

Conceitos-chave:

Loop engineering; operador × arquiteto.

O que é:

Um agente que INFERE os loops que você quereria (pelo seu "vibe") e os escreve. O degrau mais alto da escada de abstração.

Por que aprender:

Sedutor e arriscado: abstração ganha escala e perde visibilidade.

Conceitos-chave:

Meta-agente; escada da abstração.

O que é:

Osmani: um loop é um objetivo recursivo — você define um propósito e a IA itera até completar.

Por que aprender:

Todo loop sólido tem 2 pilares: o objetivo (o quê) e a verificação (como ela sabe que parou).

Conceitos-chave:

Objetivo recursivo; objetivo + verificação.

O que é:

Para rodar através de várias janelas de contexto, externalize o estado: git + arquivos de progresso (harness da Anthropic).

Por que aprender:

Cada sessão: lê o estado, faz 1 feature, self-verify, commita, deixa limpo. O disco vira a memória longa.

Conceitos-chave:

Context window; estado externalizado; 1 feature por sessão.

O que é:

Nate Herk: o Steinberger fazer isso não significa que se aplica a você. Há loops por cadência, por evento e 24/7.

Por que aprender:

Nem todo mundo precisa de 24/7 — copiar a frota por status é erro, não engenharia.

Conceitos-chave:

Cadência × evento × 24-7; ferramenta certa pro seu caso.

Ver Completo

4.2~55 min

🧱 Padrões avançados

O kit de padrões da frota: Ralph loop, loops agendados, worktrees, guardrails, verificação adversarial, fan-out e memória.

O que é:

Huntley/HumanLayer: um loop de shell infinito que repete o mesmo prompt; cada volta muta o código, que vira o estado inicial da próxima.

Por que aprender:

Potente e perigoso: "bizarre emergent behavior" se rodar demais. Combine sempre com guardrails.

Conceitos-chave:

Ralph loop; o one-liner while :; do ...; done.

O que é:

Lewis (relatado): um job que o agente repete — acorda num schedule/evento, lê o estado, faz 1 job escopado, grava, dorme.

Por que aprender:

Manager classifica o backlog; worker implementa e abre PRs; control plane de Issues; humano aprova o merge.

Conceitos-chave:

Split manager/worker; control plane; permissões fixas.

O que é:

Worktree isola o trabalho paralelo; sandbox isola o ambiente; permissões fixas isolam o que o agente PODE fazer.

Por que aprender:

Permissões fixas são como você deixa um loop rodar sem fazer algo irreversível.

Conceitos-chave:

Git worktree; sandbox; permissões fixas.

O que é:

Consenso grassroots: "os guardrails são o trabalho de verdade, não os agentes". O worker abre PR mas nunca dá merge; humano aprova.

Por que aprender:

O agente é a parte fácil; o difícil é desenhar os limites que o cercam.

Conceitos-chave:

Guardrails; prompt de permissões; porta final humana.

O que é:

Um 2º agente (ou painel) que tenta QUEBRAR o trabalho, prompted para refutar. Só aprova quando não consegue.

Por que aprender:

Quem faz nunca dá a própria nota — verificação levada ao ataque.

Conceitos-chave:

Verification specialist (especulação, não fato); refutação.

O que é:

Manager promptando agentes que promptam agentes ("Russian nesting dolls"). O padrão: orquestrar → delegar → verificar.

Por que aprender:

Fan-out (A→N) dá velocidade; a verificação (N→1) impede N erros virarem um produto quebrado.

Conceitos-chave:

Fan-out; orquestração; A → N → 1.

O que é:

O loop atravessa episódios: agir → feedback → refletir em texto → guardar na memória episódica → tentar melhor na próxima.

Por que aprender:

Aprende por linguagem, não por re-treino. Um worker que guarda o aprendido melhora a cada ticket.

Conceitos-chave:

Cross-trial memory; Reflexion; memória episódica.

Ver Completo

4.3~55 min

🛰️ Riscos, custo e estudo de caso

O fecho do curso: os perigos reais do loop autônomo, e como este próprio curso foi auditado por um loop maker/checker.

O que é:

Osmani: entregar o controle total ao loop e parar de ler a saída. Você continua o revisor, sobretudo no começo.

Por que aprender:

O loop não sente quando deriva; você é o sensor que faltou.

Conceitos-chave:

Cognitive surrender; delegar com revisão × render-se.

O que é:

Firecrawl alerta custo e "dívida de compreensão". Sullivan rejeita "tokenmaxxing" e também o "promptchud".

Por que aprender:

O meio-termo: agentes que reproduzem problemas reais do seu produto.

Conceitos-chave:

Comprehension debt; tokenmaxxing; promptchud.

O que é:

Nate: já teve loops de 12h+ que não eram úteis. O útil costuma ser ~35 min a poucas horas.

Por que aprender:

Um "chunky loop antes de dormir" (4–8h) pode render; mas não precisa de um loop de 4 dias.

Conceitos-chave:

Régua de duração; chunky loop noturno; deriva.

O que é:

A IA nunca acerta de primeira; terceirizar o ciclo de feedback-e-iteração para a IA faz a qualidade subir muito mais cedo.

Por que aprender:

É o motivo de pagar o preço dos riscos: a curva chega a "bom o bastante" antes.

Conceitos-chave:

Linha humano (lenta) × linha loop (rápida) até 90–95%.

O que é:

Este curso saiu de um loop maker/checker: DISCOVER → EXTRACT (maker) → VERIFY (checker separado e adversarial) → SYNTHESIZE.

Por que aprender:

O modelo que ACHA a fonte nunca a AVALIA — a separação de papéis é o que dá confiança.

Conceitos-chave:

Pipeline discover→extract→verify→synthesize.

O que é:

Thumbnails (rubrica + scorer), avião 3JS (render no browser, ~37 min), Abbey Road em CSS (nota ≥9 ou cap 8, parou no V7), edição de vídeo (beats alinhados).

Por que aprender:

Em todos, o gargalo é o mesmo: fazer a verificação ser objetiva o bastante para saber quando parar.

Conceitos-chave:

Condição de parada concreta; scorer dedicado; cap de passes.

O que é:

Em loop: tarefas repetitivas, revisáveis, de alto valor, com checker embutido. Para o resto, prompte uma vez.

Por que aprender:

Rode loops na cadência certa pro SEU caso — não 24/7 por status. A frase do curso: loop só com verificação.

Conceitos-chave:

"Faça isto / Pule isto"; loop só com verificação.

Ver Completo

← Trilha 3 Início →