Pular para o conteúdo
TRILHA 1

🧭 Fundamentos: o que é um loop de agente

Todo mundo desenha "loop de agente" de um jeito diferente. Esta trilha mostra o esqueleto que está por baixo de todos eles — reason → act → observe — os 6 elementos que toda fonte concorda, e o mapa das 11 escolas que confundem quem está começando. Cada termo é explicado na hora que aparece.

Quatro diagramas do mesmo loop vistos de ângulos diferentes OBJETIVO + o que é "pronto" reason · pensar act · agir observe · ver
3
Módulos
19
Tópicos
~2h
Duração
Base
Nível
Progresso da trilha: 0% 0 de 19

Mapa da trilha

Conteúdo detalhado

1.1~40 min

🧭 O esqueleto: reason → act → observe

Por baixo de todo desenho complicado, o loop é sempre os mesmos três passos repetindo até "pronto".

O que é:

Uma IA que raciocina o que fazer, age, e observa o resultado — repetindo até o objetivo ser atingido.

Por que aprender:

É a base de tudo; sem ela, os "swarms" e "fleets" viram só jargão.

Conceitos-chave:

LLM, ferramenta, iteração, objetivo.

O que é:

Think→Act→See, "modelo usa ferramentas", "roda sozinho" e "um chefe, vários ajudantes" — todas a mesma ideia.

Por que aprender:

Você para de achar que são coisas diferentes e enxerga o esqueleto único.

Conceitos-chave:

Mesma planta, quatro disfarces.

O que é:

O passo em que o agente lê o próprio resultado em vez de supor que funcionou.

Por que aprender:

É o que faz o loop convergir; sem observar, ele entrega lixo com confiança.

Conceitos-chave:

Observar = ground truth; base da checagem "pronto?".

O que é:

Um estagiário que você não microgerencia: você dá o objetivo, ele descobre o próximo passo e checa o próprio trabalho.

Por que aprender:

Ajuda a calibrar o que delegar e o que verificar.

Conceitos-chave:

Objetivo dado, passos descobertos, autocorreção.

O que é:

Prompt único = uma resposta e acabou; loop = muitas voltas até verificar que terminou.

Por que aprender:

A maioria das tarefas é prompt único; loop é para quando há verificação e iteração.

Conceitos-chave:

One-shot × iterativo; o custo de cada um.

O que é:

Cada volta é um passo; o loop circula até a checagem "pronto?" passar ou um limite de segurança parar.

Por que aprender:

Te dá o gabarito mental que serve para qualquer ferramenta de agente.

Conceitos-chave:

Volta = passo; guardrail; glossário base do curso.

Ver Completo
1.2~40 min

🧩 O núcleo invariante: 6 elementos

Tire as discordâncias e sobra isto: as 6 peças que você liga para montar qualquer loop.

O que é:

Um LLM no centro decide o que fazer a cada volta. Você não programa os passos; o modelo escolhe.

Por que aprender:

Tire o modelo e não há loop, só um script.

Conceitos-chave:

Modelo dirige cada iteração.

O que é:

As ações que o modelo pode tomar: ler/escrever arquivos, rodar comandos e testes, buscar, chamar uma API.

Por que aprender:

Sem ferramentas o modelo só fala, não faz. O artesanato está nas ferramentas.

Conceitos-chave:

Tool-calling; descrição clara das ações.

O que é:

O resultado de cada ação volta para o contexto, então a próxima volta é mais informada que a anterior.

Por que aprender:

Para tarefas longas, escreva o estado em disco (um arquivo de progresso + commits) para sobreviver entre sessões.

Conceitos-chave:

Contexto, context window, estado externalizado.

O que é:

Um objetivo claro, escrito de modo que o modelo saiba quando terminou. "Todos os testes passam" é objetivo; "melhore o código" não é.

Por que aprender:

É um dos poucos elementos que TODA fonte concorda ser essencial.

Conceitos-chave:

Objetivo verificável × objetivo vago.

O que é:

Antes de continuar, o agente confere o próprio trabalho contra o objetivo: roda os testes, relê o requisito, confirma que o arquivo mudou.

Por que aprender:

A Anthropic chama "verifique seu trabalho" de "o passo mais subestimado". É o que separa um loop que converge de um que produz lixo confiante.

Conceitos-chave:

gather → act → verify → repeat.

O que é:

Algo que termina o loop: o objetivo cumprido (testes passam) + um teto duro (máximo de voltas).

Por que aprender:

As fontes divergem aqui — exatamente por isso você precisa definir uma de propósito. Não suponha que o modelo para sozinho.

Conceitos-chave:

max_turns; objetivo é invariante, parada não.

Ver Completo
1.3~50 min

🗺️ O mapa do campo: 11 escolas

Não existe uma definição única de "loop de agente". Aqui está o mapa das 11 que circulam — e onde elas discordam.

O que é:

Auditar 45 fontes verificadas revela 11 mentais distintos do "loop" — seu instinto de confusão estava certo.

Por que aprender:

Saber que discordam te imuniza contra "fulano disse, então é a verdade".

Conceitos-chave:

Convergência mínima × fratura nas bordas.

O que é:

"Um LLM usando ferramentas num loop até a tarefa terminar" (Willison, Anthropic, LangChain). O loop é trivial; o artesanato são as ferramentas.

Por que aprender:

É a definição-base. Mas hoje é também o "saco de pancada" que os praticantes atacam por ser minimalista demais.

Conceitos-chave:

Agente = loop, numa frase.

O que é:

Cada volta = pensar → agir → observar, repetindo. A única escola que nomeia um ciclo de cognição interno.

Por que aprender:

É o vocabulário que você mais vai encontrar em docs e papers.

Conceitos-chave:

ReAct, "thought" (pensamento sem observação).

O que é:

Auto-verificação (o mesmo agente confere) × avaliador separado (um segundo agente dá nota até PASS).

Por que aprender:

É a raiz do padrão maker→checker que você usa na Trilha 2.

Conceitos-chave:

Evaluator-optimizer; o gerador nunca se auto-aprova.

O que é:

Um Runner/orquestrador é dono do loop (OpenAI/Google/Bedrock, com max_turns) × um loop autônomo que se auto-prompta e roda sem supervisão (AutoGPT).

Por que aprender:

Mostra que "loop" pode ser um objeto de runtime OU um sistema agendado.

Conceitos-chave:

Runner, max_turns, auto-prompt.

O que é:

"Projete o loop, não o prompt"; loop de memória entre tentativas (Reflexion); "loop não é o primitivo certo" (swyx); e a armadilha terminológica: "loop" = human-in-the-loop.

Por que aprender:

Evita copiar um guia de HITL achando que é padrão de build.

Conceitos-chave:

HITL = supervisão humana, não cognição do agente.

O que é:

Quem é dono, o que termina o loop, se "verificar" é parte dele, o escopo de uma iteração, se ferramentas são essenciais, e se "loop" é o primitivo certo.

Por que aprender:

Saber os eixos te deixa ler qualquer definição e localizar onde ela cai.

Conceitos-chave:

6 eixos; o núcleo invariante por baixo.

Ver Completo
← Início Trilha 2: Quando usar loop →