Trilha 3 — Implementacao Tecnica

Mapa da trilha

3.1 ~35 min

🔄 Loop Basico com Claude Code

/loop, /goal, plan.md

3.2 ~40 min

⚙ Workflows com Archon

Deterministico, mix de modelos

3.3 ~35 min

📊 Dashboard de Controle

Agent Control Plane, HITL

3.4 ~30 min

💰 Otimizacao de Custos

Providers, routing, metricas

Conteudo detalhado

3.1 ~35 min

🔄 Loop Basico com Claude Code

Setup do /loop skill, criacao de plan.md, prompt para o orchestrator configurar o loop, demo com task list sequencial e wake-up automatico.

O que e:

O Claude Code tem uma capability built-in chamada "loop skill" que ensina o agente a configurar loops automaticamente.

Por que aprender:

E o ponto de partida mais simples para loop engineering. Um unico prompt carrega todo o sistema.

Conceitos-chave:

Loop skill como capability. Prompt inicial. Auto-configuracao pelo agente.

O que e:

Um documento markdown com tarefas numeradas que o agente processa item por item, marcando cada uma como concluida.

Por que aprender:

A qualidade do plan.md determina a qualidade do output. Tarefas bem definidas = resultados melhores.

Conceitos-chave:

Granularidade ideal. Criterio de aceitacao por tarefa. Ordem sequencial vs paralela.

O que e:

O prompt que carrega o loop skill e instrui o agente a processar o plan.md. O agente configura /loop sozinho.

Por que aprender:

Um bom prompt inicial e a diferenca entre um loop funcional e um loop caótico.

Conceitos-chave:

"Load the loop skill". Auto-setup do /loop. Prompt como sistema, nao como instrucao.

O que e:

O agente completa uma tarefa, agenda o proximo wake-up via /loop, e continua ate concluir todas as tarefas do plan.md.

Por que aprender:

Ver o fluxo real ajuda a entender como os primitivos se conectam na pratica.

Conceitos-chave:

Wake-up cycle. Validacao entre tarefas. Prompt auto-gerado pelo agente.

O que e:

Colecao de prompts copiáveis para os cenarios mais comuns: task runner, code review, e exploracao.

Por que aprender:

Comecar com prompts testados acelera a adocao e evita erros comuns de configuracao.

Conceitos-chave:

Templates reutilizaveis. Parametros ajustaveis. Adaptacao por contexto.

O que e:

O loop basico roda numa unica sessao, usa um unico modelo e nao tem state externo. Isso limita escala e confiabilidade.

Por que aprender:

Entender as limitacoes motiva a busca por solucoes mais robustas nos modulos seguintes.

Conceitos-chave:

Single session = context bloat. Single model = custo alto. Sem state = sem durabilidade.

Ver Completo

3.2 ~40 min

⚙ Workflows Deterministicos com Archon

O harness builder do Cole Medin: workflows onde o humano define o processo, mix de modelos por step, e durabilidade com Postgres/Neon.

O que e:

Archon e a ferramenta do Cole Medin para orquestrar sessoes de coding agents com workflows definidos pelo humano.

Por que aprender:

Representa a abordagem oposta ao loop puro: o humano define o processo, nao o agente.

Conceitos-chave:

Harness vs loop. Workflow file. Steps deterministicos. Mix de providers.

O que e:

Pipeline deterministico: extrair issue, buscar contexto, classificar tipo, pesquisar, implementar, validar e criar PR.

Por que aprender:

E o exemplo mais pratico de como combinar determinismo com LLM, usando o agente so onde realmente precisa.

Conceitos-chave:

Pipeline como grafo. Steps deterministicos vs LLM-driven. Classificacao como decisao leve.

O que e:

No deterministico, o humano define quais steps existem e em que ordem. No loop puro, o agente decide tudo sozinho.

Por que aprender:

Entender esse trade-off e fundamental para escolher a abordagem certa para cada cenario.

Conceitos-chave:

Confiabilidade vs flexibilidade. Agente como executor, nao como tomador de decisao.

O que e:

Cada node do workflow pode usar um modelo diferente. Steps leves usam modelos baratos; steps criticos usam modelos fortes.

Por que aprender:

E a principal alavanca de otimizacao de custo em workflows autonomos.

Conceitos-chave:

Model routing. Custo por step. Provider mixing. Kimi para exploracão, Claude para implementacao.

O que e:

Logs, runs e conversations sao gravados em Postgres/Neon. Se a maquina cair, o workflow retoma do step exato.

Por que aprender:

Durabilidade e o que transforma um experimento em sistema confiavel.

Conceitos-chave:

State store. Resume from step. Neon branching para workers paralelos.

O que e:

Prompts otimizados para cada step: classificacao, pesquisa, implementacao, validacao e code review.

Por que aprender:

Prompts prontos economizam tempo e servem de base para adaptacao ao seu contexto.

Conceitos-chave:

Template por step. Markdown como contexto. Handoff entre steps via documentos.

Ver Completo

3.3 ~35 min

📊 Dashboard de Controle (Agent Control Plane)

Observabilidade em tempo real: ver decisoes do orchestrator, cost tracking, human-in-the-loop e deploy remoto.

O que e:

Dashboard open source que Cole construiu para gerenciar loops com durabilidade, observabilidade e human-in-the-loop.

Por que aprender:

Sem controle visual, loops sao caixas pretas que queimam tokens sem feedback.

Conceitos-chave:

Dashboard como sistema nervoso. Open source no GitHub. Backend com Pi/Kimi.

O que e:

Todos os loops, eventos e logs sao gravados em Postgres (via Neon) para durabilidade e analytics.

Por que aprender:

State externo permite retomar loops apos crashes e analisar patterns de execucao historicamente.

Conceitos-chave:

Orchestrator le state do banco. Workers atualizam state no banco. Banco como fonte de verdade.

O que e:

Ver em tempo real quais decisoes o orchestrator toma, quantos workers dispara, e o progresso de cada round.

Por que aprender:

Poder ver e entender as decisoes do orchestrator e essencial para debugar e melhorar o loop.

Conceitos-chave:

Decision log. Round history. Worker dispatch tracking. Event stream.

O que e:

Metricas de tokens consumidos por round, por worker, e custo total do run. Visivel no dashboard.

Por que aprender:

Sem cost tracking, e impossivel otimizar. O dashboard mostrou 1M+ tokens para um app simples.

Conceitos-chave:

Tokens por round. Custo do orchestrator vs workers. Breakdown por modelo.

O que e:

O loop pode pausar apos cada round esperando aprovacao humana antes de continuar.

Por que aprender:

HITL e a guardrail essencial que evita o problema de "run for a day, come back to crap".

Conceitos-chave:

Pause entre rounds. Approve/reject workflow. Permission groups. Identity verification.

O que e:

O dashboard pode ser deployado na cloud via Retool, permitindo acesso remoto e compartilhamento com o time.

Por que aprender:

Deploy remoto transforma uma ferramenta local em infraestrutura de equipe.

Conceitos-chave:

Import React para Retool. Conexao com Neon. Permission groups. Audit trails.

Ver Completo

3.4 ~30 min

💰 Otimizacao de Custos

Mix de providers, model routing, state externo, worktrees e metricas para manter loops viaveis financeiramente.

O que e:

Usar providers diferentes para roles diferentes: modelos baratos para orquestracao, modelos fortes para implementacao.

Por que aprender:

E a principal alavanca para reduzir custo sem sacrificar qualidade no output final.

Conceitos-chave:

Pi/Kimi como orchestrator barato. Claude Code para execucao. Codex para review.

O que e:

Rotear tarefas para modelos com base na complexidade: classificacao simples usa Haiku, implementacao complexa usa Claude.

Por que aprender:

Cada token conta. Usar Opus para classificar bug vs feature e desperdicio.

Conceitos-chave:

Complexity-based routing. Custo por token por modelo. Decisoes leves vs pesadas.

O que e:

Manter estado no banco externo em vez de acumular no context window do LLM. Cada sessao comeca limpa e le o estado.

Por que aprender:

Context bloat e a causa #1 de degradacao em loops longos. State externo resolve.

Conceitos-chave:

Context window como cache. Banco como storage. Sessao stateless. Read-execute-write cycle.

O que e:

Git worktrees criam copias isoladas do repo para que N agentes trabalhem em paralelo sem conflitos de codigo.

Por que aprender:

Paralelismo real requer isolamento real. Worktrees sao o mecanismo mais pratico para isso.

Conceitos-chave:

Worktree por worker. Branch por tarefa. Merge apos validacao. Port conflict avoidance.

O que e:

Batch: acumular tarefas e processar de uma vez (mais barato). Real-time: processar imediatamente (mais responsivo).

Por que aprender:

Escolher o modo errado desperdiça dinheiro ou tempo. Contexto determina a escolha.

Conceitos-chave:

Batch para GitHub issues noturno. Real-time para fixes urgentes. Trade-off latencia vs custo.

O que e:

As tres metricas essenciais: tokens consumidos por tarefa, custo por round do orchestrator, e taxa de sucesso dos workers.

Por que aprender:

O que nao se mede nao se otimiza. Essas metricas sao o minimo para evitar desperdicio.

Conceitos-chave:

Tokens/task como KPI. Cost per round. Success rate. Trend analysis. Budget alerting.

Ver Completo

← Trilha 2: Trade-offs Proxima: Trilha 4 →