1.2 O núcleo invariante: 6 elementos

Seis blocos luminosos — chip, chave, cristal de memória, alvo, lupa e freio — se encaixando numa só máquina

O que ver: seis peças que se encaixam numa máquina só. Cada seção abaixo é uma peça — junte todas e você tem um loop.

🧠 O modelo (o tomador de decisão)

No centro fica um único LLM que decide o que fazer a cada volta. No Claude Code, é o próprio Claude lendo suas instruções e escolhendo a próxima ação. Você não roteiriza os passos — o modelo escolhe.

🧩 Por que é universal

Toda fonte que de fato descreve um loop de agente põe um modelo no centro dirigindo cada iteração. A definição de uma linha da Anthropic é literalmente: "LLMs usando ferramentas, de forma autônoma, num loop". Tire o modelo e não há loop — só um script com passos fixos.

🔧 As ferramentas (como age no mundo)

Ferramentas são as ações que o modelo pode tomar: ler e escrever arquivos, rodar comandos no terminal, rodar testes, buscar, chamar uma API. No Claude Code elas já vêm embutidas. Sem ferramentas, o modelo só fala — não faz.

💡 O artesanato está nas ferramentas

A Anthropic diz que é "crucial projetar conjuntos de ferramentas e sua documentação com clareza". Ou seja: o loop em si é trivial; o trabalho de verdade está em quais ferramentas o agente tem e quão bem descritas elas estão.

📁

ler/editar arquivos

⌨️

rodar comandos

🧪

rodar testes

🌐

buscar / chamar API

🧵 Estado / feedback carregado adiante

O resultado de cada ação volta para o contexto, então a próxima volta é mais esperta que a anterior. Pode ser um resultado de ferramenta, um teste que falhou, ou um arquivo de notas que o agente relê.

📊 Para tarefas longas: estado em disco

A pesquisa da Anthropic sobre agentes de longa duração é explícita: um modelo cru num loop não basta. O agente precisa externalizar o estado para git + arquivos de progresso e "deixar o ambiente limpo" para a próxima volta retomar.

🎯 O objetivo (o que "pronto" significa)

Um objetivo claro, escrito de modo que o modelo saiba quando terminou. "Fazer todos os testes da pasta passarem" é um objetivo. "Melhorar o código" não é.

✓ Objetivo verificável

✓"Todo teste em /tests passa ao rodar npm test."
✓"Abaixo de 50 palavras E menciona o preço."
✓"O build compila sem erros."

✗ Objetivo vago

✗"Melhore o código."
✗"Deixe bom."
✗"Limpe isso aqui."

🧩 Um dos poucos invariantes de verdade

Quase toda fonte — formal ou praticante — nomeia um objetivo como o alvo do loop: tarefa completa, critério de sucesso, avaliador dá PASS. Até a versão mais radical mantém: "dê um objetivo, depois faça o loop do objetivo".

✅ A verificação (o passo que pulam)

Antes de continuar, o agente confere o próprio trabalho contra o objetivo: roda os testes, relê o requisito, confirma que o arquivo mudou. No Claude Code, o padrão natural é reunir contexto → agir → verificar → repetir.

Leia o diagrama: a verificação é a porteira. Se passou, "pronto". Se não, o loop volta para agir — e é isso que o faz convergir em vez de derivar.

💡 "O passo mais subestimado"

O SDK de Agentes da Anthropic nomeia "verifique seu trabalho" como uma etapa distinta e a chama de "a mais subestimada". É o que separa um loop que converge num resultado real de um que produz lixo com confiança.

🛑 A condição de parada (você controla o freio)

Algo que termina o loop. O mais limpo é o objetivo cumprido (testes passam). Mas adicione também um teto duro: número máximo de voltas, ou você assistindo e apertando CTRL+C. Não suponha que o modelo sempre para sozinho.

🚨 Aqui as fontes brigam — por isso você define o freio

Ferramentas formais entregam um teto duro de voltas (max_turns). Já loops "grassroots" tipo o Ralph não têm parada do lado do modelo e rodam até um operador matar. Um objetivo é invariante; um "pare" emitido pelo modelo não é. Então o freio é você quem põe.

# Checklist dos 6 elementos — cole no Claude Code e ele monta seu loop

Quero rodar uma tarefa em loop. Antes de começar, confirme comigo os 6 elementos:
1. Modelo: você (o agente) decide cada passo.
2. Ferramentas: pode usar <ex.: editar arquivos em /src, rodar `npm test`> — e NADA fora disso.
3. Estado: anote o progresso em PROGRESS.md a cada passo que melhorar.
4. Objetivo: <ex.: todos os testes em /tests passam>.
5. Verificação: como você vai checar <ex.: rodar `npm test` e ler a saída>.
6. Parada: pare quando o objetivo for cumprido OU após <ex.: 10> tentativas.

Repita os 6 de volta pra mim, então comece.

Como verificar: o agente deve repetir os 6 itens preenchidos antes de agir. Se ele pular a verificação ou a parada, seu loop ainda está incompleto — reforce no prompt.

🧾 Resumo do Módulo

✓

Modelo — o LLM no centro decide cada volta; sem ele é só script.

✓

Ferramentas — as ações (tool-calling); o artesanato está aqui.

✓

Estado — o resultado volta ao contexto; em tarefa longa, escreva em disco.

✓

Objetivo — verificável, não vago; um dos poucos invariantes.

✓

Verificação — reunir → agir → verificar → repetir; o passo mais subestimado.

✓

Parada — objetivo + teto duro (max_turns); você põe o freio.

1.3 — O mapa do campo: 11 escolas

← 1.1 1.3 →

🧩 O núcleo invariante: 6 elementos