Trilha 2 — Configuracao

2.1 ~30 min

🛠️ Setup do ambiente

Instalacao, autenticacao e configuracao base. Em 30 min voce esta operando os 3 modelos.

O que e:

CLI oficial que roda Opus 4.7 no terminal, com acesso direto a arquivos do projeto e historico persistente.

Por que aprender:

E a melhor experiencia para tarefas longas que envolvem ler/editar muitos arquivos no projeto.

Conceitos-chave:

npm install, autenticacao via OAuth, comandos basicos (claude, /help, /clear).

O que e:

Cursor tem dropdown nativo com modelos. Em VS Code, use Continue.dev ou Cline. Em ambos, configure os 3 modelos como atalhos.

Por que aprender:

Trocar de modelo precisa ser de 1 clique — atrito de configuracao mata adocao do setup.

Conceitos-chave:

Settings.json, model picker, atalho de teclado para trocar modelo.

O que e:

OpenRouter agrega modelos de varios providers em uma so chave. Util para DeepSeek (que nao tem CLI nativo no terminal).

Por que aprender:

Sem ele, voce precisa de 3 contas e 3 chaves separadas. Centralizar simplifica e da metricas unificadas.

Conceitos-chave:

Proxy de modelos, billing unificado, fallback automatico.

O que e:

Padrao: ANTHROPIC_API_KEY, OPENAI_API_KEY, OPENROUTER_API_KEY em ~/.zshrc ou .env por projeto.

Por que aprender:

Vazar chave por descuido (no git ou em log) custa dinheiro real. Setup correto desde o dia 1.

Conceitos-chave:

Env vars, gitignore, rotacao de chave, escopo por projeto.

O que e:

No Cursor: defina DeepSeek como padrao, GPT-5.5 como "Plan", Opus como "Polish". Atalhos por papel.

Por que aprender:

Quando o modelo padrao e o barato, voce escolhe os caros conscientemente — economia automatica.

Conceitos-chave:

Default-cheap, atalho por papel, configuracao por workspace.

O que e:

Mande "fatorial em python" para os 3 modelos. Compare resposta, tempo e custo. Confirma que tudo conecta.

Por que aprender:

Validar antes de tentar fluxo complexo evita 1h de debug por chave errada.

Conceitos-chave:

Smoke test, baseline de qualidade, validacao em paralelo.

Ver Completo

2.2 ~30 min

🚦 Roteamento de tarefas

O fluxo plan → exec → review aplicado na pratica. Quando trocar de modelo e como reconhecer o gatilho.

O que e:

1) GPT-5.5 produz plano em markdown. 2) Opus revisa UX/produto. 3) DeepSeek implementa. 4) GPT-5.5 ou Opus revisa o diff.

Por que aprender:

Memorize esse ciclo — e o "padrao de fabrica" que cobre 80% das features.

Conceitos-chave:

Pipeline de 4 etapas, papel por etapa, handoff explicito.

O que e:

DeepSeek travou em loop, fez 3 tentativas erradas, ou esta inventando API que nao existe — pare. Suba para GPT-5.5 com o contexto.

Por que aprender:

Insistir com modelo errado queima tokens em ciclos vazios. Reconhecer sinal cedo economiza horas.

Conceitos-chave:

Loop de retentativa, alucinacao, escalada de modelo.

O que e:

Tabela: "endpoint REST simples"→DeepSeek. "Migracao de schema"→GPT-5.5. "Microcopy de erro"→Opus. E assim por diante.

Por que aprender:

Imprime e cola na parede. Em 1 semana voce internaliza e nao precisa mais consultar.

Conceitos-chave:

Tabela de roteamento, internalizacao por repeticao, mapa mental.

O que e:

Bug de implementacao = volta para etapa 3. Bug de plano = volta para etapa 1. Saber diagnosticar evita reescrita inteira.

Por que aprender:

Maioria dos devs reescreve tudo. Voltar para a etapa certa economiza 80% do retrabalho.

Conceitos-chave:

Diagnose por etapa, retorno minimo necessario, principio da raiz.

O que e:

Para tarefas obvias (renomear, ajuste de string, fix tipo), pule plan e revisao. So execute. Cuidado: defina criterio claro.

Por que aprender:

Aplicar pipeline completo em microtarefas vira burocracia. Saber quando pular acelera o dia-a-dia.

Conceitos-chave:

Fast path, criterio de simplicidade, override do pipeline.

O que e:

Algumas tools (Aider, Continue) tem "auto-routing": detectam tipo de pergunta e escolhem modelo. Util quando setup amadurece.

Por que aprender:

Roteamento manual e bom no inicio (voce aprende). Depois, automacao reduz fadiga de decisao.

Conceitos-chave:

Auto-routing, regras condicionais, automacao gradual.

Ver Completo

2.3 ~30 min

📝 Templates de prompt por papel

Prompts copiaveis para cada modelo. O "system prompt" certo faz cada modelo brilhar no papel dele.

O que e:

Prompt que pede output estruturado: lista de arquivos a tocar, ordem de implementacao, criterios de aceitacao, riscos.

Por que aprender:

Plano em formato fixo permite passar como input limpo para o executor.

Conceitos-chave:

Output estruturado, criterios de aceitacao, lista de arquivos.

O que e:

Prompt focado em sensibilidade: "veja se o copy esta acolhedor, se a hierarquia visual esta clara, se ha friccao desnecessaria".

Por que aprender:

Opus precisa de prompts que estimulem julgamento, nao instrucoes mecanicas.

Conceitos-chave:

Prompts abertos, foco em julgamento, espaco para sugerir.

O que e:

Prompt minimalista que passa o plano + restricoes. "Nao questione, nao melhore, implemente. Se duvida, pare e pergunte."

Por que aprender:

DeepSeek com prompt aberto inventa demais. Com prompt fechado, e maquina de produtividade.

Conceitos-chave:

Prompt fechado, anti-criatividade, fail-fast em duvida.

O que e:

Passa: plano original + diff implementado. Pede: bugs, riscos de seguranca, aderencia ao plano, sugestoes minimas.

Por que aprender:

Revisao sem o plano e cega — o revisor nao sabe o que era esperado. Sempre passe os 2.

Conceitos-chave:

Contexto duplo (plano+diff), revisao informada, output em checklist.

O que e:

Pasta /prompts/ com arquivos: plan.md, exec.md, review.md, refactor.md. Versiona junto com o codigo.

Por que aprender:

Time inteiro usa os mesmos prompts. Onboarding fica trivial, qualidade fica consistente.

Conceitos-chave:

Prompts como codigo, versao em git, reuso em equipe.

O que e:

Saida confusa = peca formato. Falta precisao = de exemplo. Inventa demais = adicione "se nao souber, fale".

Por que aprender:

Maioria dos prompts melhora com 3 ajustes simples. Saber quais aplicar acelera o ciclo.

Conceitos-chave:

Iteracao de prompt, anti-alucinacao, exemplo few-shot.

Ver Completo

2.4 ~30 min

🔗 Passando contexto entre modelos

Como manter coerencia quando voce troca de modelo no meio de uma tarefa.

O que e:

Em vez de "lembrar" no chat, salve plano em PLAN.md, decisoes em DECISIONS.md. Cada modelo le do mesmo lugar.

Por que aprender:

Trocar de modelo nao perde contexto se ele esta em arquivo. Janela de chat e volatil; arquivo e durable.

Conceitos-chave:

Memoria externa, artefato durable, single source of truth.

O que e:

Arquivos que cada tool le automaticamente: stack, padroes, comandos uteis. Garante que qualquer modelo segue as mesmas regras.

Por que aprender:

Sem isso, voce repete as mesmas instrucoes em todo prompt. Com isso, todos os modelos comecam alinhados.

Conceitos-chave:

Arquivo de convencoes, leitura automatica, contexto compartilhado.

O que e:

Antes de passar para o proximo modelo, peca ao atual: "resuma em 200 palavras o que decidimos e por que". Esse resumo vira o input do proximo.

Por que aprender:

Comprime contexto sem perder o essencial. Reduz custo de input no proximo modelo.

Conceitos-chave:

Compactacao de contexto, handoff resumido, lossy mas eficiente.

O que e:

DeepSeek: 128k. GPT-5.5: 256k. Opus 4.7: 1M. Para projetos grandes, Opus le tudo de uma vez; outros precisam de filtragem.

Por que aprender:

Saber o limite evita "input too long" no meio do fluxo — voce planeja a divisao antes.

Conceitos-chave:

Context window, chunking, escolha por capacidade.

O que e:

Conversa longa acumula erros e "achismos". A cada nova feature, /clear e comece com contexto limpo + arquivos relevantes.

Por que aprender:

Modelos confusos por contexto sujo geram codigo confuso. Reset frequente mantem qualidade.

Conceitos-chave:

Higiene de contexto, reset preventivo, escopo por tarefa.

O que e:

Anthropic e OpenRouter cacheiam prefixo do prompt. Mande primeiro o contexto grande, depois pergunte. Ate 90% off em input repetido.

Por que aprender:

Em conversas iterativas (10+ turnos), cache transforma fatura. E "free money".

Conceitos-chave:

Prompt caching, prefix sharing, otimizacao por estrutura.

Ver Completo

2.5 ~30 min

✅ Workflow de revisao cruzada

O segredo da qualidade no setup multi-modelo: quem escreveu nao revisa.

O que e:

Mesmo modelo que escreveu o codigo nao percebe seus proprios bugs (vies de confirmacao). Revisor diferente pega 60% mais issues.

Por que aprender:

E a regra mais simples e maior aliada na qualidade. Vale o custo extra.

Conceitos-chave:

Vies de confirmacao, segundo par de olhos, revisao cruzada.

O que e:

Bugs, seguranca, performance, aderencia ao plano, edge cases, naming, tests, documentacao. 8 itens fixos para todo review.

Por que aprender:

Checklist evita revisao subjetiva e garante consistencia entre tasks.

Conceitos-chave:

Checklist fechado, 8-point review, output padronizado.

O que e:

Revisor da nota: ✓ aprovado, ⚠️ ajustes simples (volta para etapa 3 com correcoes), ✗ replanejar (volta para etapa 1).

Por que aprender:

Decisao binaria perde nuance. Trinario e mais fiel a realidade.

Conceitos-chave:

3 estados de revisao, gradacao de problema, decisao informada.

O que e:

Em codigo que toca auth/payment/data, faz um segundo pass de revisao com prompt especifico de seguranca (SQL injection, XSS, IDOR).

Por que aprender:

Revisor generalista perde vulnerabilidades sutis. Pass especializado pega 90% delas.

Conceitos-chave:

Multi-pass review, OWASP top 10, prompts especializados.

O que e:

Action que roda em todo PR: pega o diff, manda para GPT-5.5/Opus revisar, comenta no PR. Funciona como tech lead robotico.

Por que aprender:

Tira a revisao do fluxo manual — passa a acontecer "de graca" em todo commit.

Conceitos-chave:

CI/CD com IA, PR comments, automacao de qualidade.

O que e:

Quando a revisao muda algo importante, registre o porque. ADRs (Architectural Decision Records) servem aos modelos futuros.

Por que aprender:

Sem registro, decisoes se perdem. Modelos futuros tomam decisoes contraditorias.

Conceitos-chave:

ADR, memoria do projeto, contexto historico.

Ver Completo

2.6 ~30 min

📊 Metricas, custo e otimizacao

Como medir se o setup esta funcionando e onde aplicar a proxima rodada de otimizacao.

O que e:

Cada provider tem seu painel de uso. OpenRouter unifica os 3. Configure alerta de gasto diario.

Por que aprender:

Sem visibilidade, voce so descobre o problema na fatura. Dashboards previnem surpresa.

Conceitos-chave:

Observabilidade, alerta de gasto, dashboard unificado.

O que e:

3 metricas principais: custo medio por feature, % de PRs aprovados na primeira revisao, distribuicao real de tokens (vs 70/20/10).

Por que aprender:

"O que voce nao mede, nao melhora". KPIs te dizem se a estrategia esta funcionando.

Conceitos-chave:

KPI definitivo, distribuicao real, baseline de comparacao.

O que e:

Causas: (1) modelo padrao errado, (2) prompts longos sem cache, (3) muito retrabalho, (4) Opus virou padrao por engano.

Por que aprender:

Diagnostico rapido. Olhe a metrica → identifique a causa → ajuste em 5 min.

Conceitos-chave:

Diagnostico de custo, root cause, ajuste preciso.

O que e:

A cada 1-2 semanas, pegue uma tarefa de cada categoria e rode em 2 modelos diferentes. Compare resultado e ajuste roteamento.

Por que aprender:

Modelos evoluem mensalmente. A/B test descobre quando o roteamento atual ficou desatualizado.

Conceitos-chave:

A/B testing, evolucao de modelo, recalibracao.

O que e:

(1) prompt cache, (2) context selectivo, (3) saidas estruturadas curtas, (4) reuso de plano, (5) batch quando nao precisa de realtime.

Por que aprender:

Cada tecnica corta 20-50% dos tokens. Combinadas, divisao por 4-5 da fatura.

Conceitos-chave:

Token efficiency, output curto, batch API.

O que e:

Toda primeira sexta do mes, 15 min: olhe metricas, compare com mes anterior, ajuste 1 prompt ou 1 regra.

Por que aprender:

Setups apodrecem sem manutencao. Ritual mensal evita degradacao silenciosa.

Conceitos-chave:

Manutencao do sistema, melhoria continua, kaizen aplicado.

Ver Completo

🛠️ Configuracao — Setup, roteamento e workflow

Stack recomendado

Conteudo detalhado

🛠️ Setup do ambiente

🚦 Roteamento de tarefas

📝 Templates de prompt por papel

🔗 Passando contexto entre modelos

✅ Workflow de revisao cruzada

📊 Metricas, custo e otimizacao