Trilha 3 · Construindo seu primeiro loop

Mapa da trilha

3.1~55 min

🎯 A sequência de 7 passos

Da tarefa ao loop rodando

3.2~50 min

🧪 Loops para copiar e rodar

Cole, rode, verifique

3.3~45 min

🧰 8 ingredientes de um loop sólido

O que separa firme de frágil

3.4~45 min

⚠️ Os 8 erros comuns

As armadilhas de quem começa

Conteúdo detalhado

3.1~55 min

🎯 A sequência de 7 passos

Sete decisões em ordem que transformam uma tarefa qualquer no seu primeiro loop rodando de verdade.

O que é:

Escolha algo cujo "pronto" dá pra checar por fora da sua opinião: testes passam, formato bate, o script roda sem erro.

Por que aprender:

No 1º loop, estreite para algo com checker embutido — é o que faz o loop convergir em vez de vaguear.

Conceitos-chave:

Tarefa aberta × tarefa com checker; done-state verificável.

O que é:

Uma frase: "Todo teste em /tests passa ao rodar npm test." Vira o done-state do loop.

Por que aprender:

Objetivo vago ("limpe isso") não dá no que terminar; o loop não sabe parar.

Conceitos-chave:

Objetivo numa frase; checável × vago.

O que é:

Permita editar /src e /tests + rodar testes; SEM poder de merge ou deploy no 1º run. O worker abre um PR, o humano dá merge.

Por que aprender:

"Os guardrails são o trabalho de verdade, não os agentes." Permissão larga cedo = bagunça irreversível.

Conceitos-chave:

Permissões, guardrail, PR (pull request).

O que é:

Peça pra escrever o progresso em PROGRESS.md e commitar a cada mudança relevante, pra retomar de onde parou.

Por que aprender:

O harness da Anthropic: ler estado → progresso incremental → self-verify → commit → deixar limpo.

Conceitos-chave:

PROGRESS.md, commit, retomar entre sessões.

O que é:

Reunir contexto → 1 mudança → verificar (rodar testes) → repetir. UMA mudança por volta é deliberado.

Por que aprender:

"Trabalhar em uma feature por vez" foi crítico na pesquisa; uma mudança por volta faz o loop convergir.

Conceitos-chave:

Ciclo de 4 passos; granularidade da iteração.

O que é:

"Pare quando todos os testes passarem, ou após 10 tentativas, o que vier primeiro." Os SDKs trazem max_turns.

Por que aprender:

Sem stop, você arrisca "bizarre emergent behavior" e uma conta de tokens que não para de crescer.

Conceitos-chave:

Hard stop, max_turns, teto de tentativas.

O que é:

Assista o 1º run ao vivo; conserte as INSTRUÇÕES, não a saída. Quando falha, conserte o domínio da falha e jogue de volta na roda.

Por que aprender:

Huntley: "clay on the pottery wheel" — você modela o prompt, não a peça de cada vez.

Conceitos-chave:

Apertar o prompt; observar o run; o loop completo dos 7 passos.

Ver Completo

3.2~50 min

🧪 Loops para copiar e rodar

Prompts prontos para colar no Claude Code — para código e para texto — com objetivo, bloco e como verificar.

O que é:

Um prompt completo: objetivo (testes passam), loop de 4 passos, PROGRESS.md + commit, hard stop em 10, e o que não tocar.

Por que aprender:

É o template que você adapta para tudo. Cole, rode, observe.

Conceitos-chave:

Loop colável; objetivo + bloco + como verificar.

O que é:

Mesma forma, outro trabalho: reescrever um parágrafo até ficar abaixo de 50 palavras E mencionar o preço.

Por que aprender:

O check é Functional — confere as regras (contar palavras, achar "preço"), não se lê bem.

Conceitos-chave:

Loop fora de código; check Functional; guardrail de 5 tentativas.

O que é:

Juntos, /goal e /loop criam um loop que se dirige e se termina sozinho a partir do objetivo declarado.

Por que aprender:

Ex.: gerar 10 conceitos, pontuar por rubrica, iterar no melhor até a nota X.

Conceitos-chave:

/goal, /loop, self-directing, self-terminating.

O que é:

Adicione ao prompt: "Pause e me pergunte antes de deletar, enviar ou pagar qualquer coisa."

Por que aprender:

É o check "You-decide": ações irreversíveis passam por você antes de acontecer.

Conceitos-chave:

Portão humano; ação irreversível; aprovação.

O que é:

Ler o estado de PROGRESS.md, progredir em UMA feature, self-verify, commitar com nota, deixar limpo, repetir.

Por que aprender:

É o loop que sobrevive entre sessões e não se repete quando o contexto enche.

Conceitos-chave:

Estado externalizado; commit com nota; árvore limpa.

O que é:

Troque o checker (Functional → Visual com screenshot, ou Judgment com 2º agente) e troque o domínio.

Por que aprender:

A forma do loop é a mesma; marque as partes que você troca e reuse em qualquer tarefa.

Conceitos-chave:

Functional × Visual × Judgment; template em branco.

Ver Completo

3.3~45 min

🧰 8 ingredientes de um loop sólido

O checklist do que separa um loop que segura de um loop que desmonta no primeiro tropeço.

O que é:

Defina "pronto" de um jeito que uma máquina verifica, não "deixe bom".

Por que aprender:

Sem um done-state checável, o loop não tem como saber que terminou.

Conceitos-chave:

Done-state; verificação por máquina.

O que é:

Máximo de tentativas, orçamento ou tempo. Sempre.

Por que aprender:

É o que impede o loop de rodar pra sempre e queimar tokens à toa.

Conceitos-chave:

max_turns; orçamento; teto de tempo.

O que é:

As ações que o agente toma precisam ser confiáveis e claramente descritas.

Por que aprender:

Ferramenta mal descrita = o modelo usa errado e o loop vira ruído.

Conceitos-chave:

Descrição clara; ação confiável.

O que é:

Guarde o histórico, mas RESUMA para o contexto não inchar — um arquivo de notas.

Por que aprender:

Contexto cheio = o modelo perde o fio e custa mais caro.

Conceitos-chave:

Resumo; arquivo de notas; context window.

O que é:

Gerar → julgar → consertar → repetir. O maker nunca dá a própria nota.

Por que aprender:

Quem fez o trabalho é o pior juiz dele; um checker separado segura a qualidade.

Conceitos-chave:

Maker → checker; evaluator-optimizer.

O que é:

Job grande e multi-passo: peça um plano antes de agir. Job pequeno: pule o plano.

Por que aprender:

Planejar tudo é desperdício em tarefa pequena; não planejar quebra a tarefa grande.

Conceitos-chave:

Plano antes da ação; quando pular.

O que é:

Salve cada pensamento, ação e resultado.

Por que aprender:

Quando o loop falha de madrugada, o log é a única coisa que conta o que aconteceu.

Conceitos-chave:

Trace de pensamento/ação/resultado.

O que é:

Loops queimam tokens rápido; comece pequeno e limitado, depois escale.

Por que aprender:

Um loop sem teto e sem noção de custo vira surpresa na fatura.

Conceitos-chave:

Pequeno e limitado primeiro; escalar depois.

Ver Completo

3.4~45 min

⚠️ Os 8 erros comuns

As oito armadilhas que derrubam quem está montando o primeiro loop — e a correção de cada uma.

O que é:

O loop age, nunca checa, e entrega quebrado com confiança.

Por que aprender:

"Verifique seu trabalho" é o passo mais subestimado de todos.

Conceitos-chave:

Verificação ausente; lixo confiante.

O que é:

"Melhore o código" não dá done-state; o loop fica girando sem alvo.

Por que aprender:

Objetivo vago é a causa nº 1 de um loop que nunca "termina".

Conceitos-chave:

Vago × checável; alvo do loop.

O que é:

Iniciante supõe que o modelo para sozinho; muitos loops (Ralph) não têm parada do lado do modelo.

Por que aprender:

Ponha máximo de tentativas e assista o 1º run — a parada é sua, não do modelo.

Conceitos-chave:

Hard stop; Ralph; supervisão do 1º run.

O que é:

Mandar consertar tudo de uma vez faz o loop debater-se; uma mudança por volta converge.

Por que aprender:

A Anthropic foi explícita: "uma feature por vez" foi crítico.

Conceitos-chave:

Granularidade; uma mudança por volta.

O que é:

Deixar o 1º loop dar merge, deploy ou delete = bagunça irreversível.

Por que aprender:

Escope as permissões; o worker abre PR, ele não dá merge.

Conceitos-chave:

Escopo de permissões; PR em vez de merge.

O que é:

Sem progress + commits, um loop além de 1 context window esquece o que já tentou e se repete.

Por que aprender:

Estado em disco é o que dá memória ao loop entre janelas de contexto.

Conceitos-chave:

Estado externalizado; context window.

O que é:

Human-in-the-loop (portões de aprovação) é supervisão, não a cognição do agente.

Por que aprender:

Não copie um guia de HITL esperando um padrão de build do loop.

Conceitos-chave:

HITL = supervisão humana; loop de agente = cognição.

O que é:

Entregar controle total ao loop e parar de ler a saída — o alerta de Osmani.

Por que aprender:

Você continua o revisor, sobretudo no começo.

Conceitos-chave:

Revisor humano; não abdicar do controle.

Ver Completo

← Trilha 2: Quando usar loop Trilha 4: Loop Engineering →