Módulo 4.6 — Quando não basta

🤖 Limitações do modelo

Codex e Claude são modelos de linguagem. Têm pontos cegos previsíveis:

• Não conhecem seu contexto interno: só veem o que está no PLAN.md e nos arquivos passados
• Podem alucinar APIs/libs: sugerir algo que não existe (verifique sempre)
• Sem dados em tempo real: não sabem performance, métricas, incidentes recentes
• Conhecimento limitado por data: mudanças recentes em frameworks podem não estar no cutoff
• Não rodam código: análise estática, sem benchmarks reais

🔍 Riscos não detectáveis

Coisas que o Claudex não vê — e você precisa fazer revisão humana paralela:

• Política de empresa: "não usamos provider X por contrato"
• História do código: "última vez que mexemos aqui, quebrou Y"
• Conhecimento tribal: "esse sistema foi pensado pra A, não B"
• Compliance específico: regulamentação setorial muito específica
• Dinâmica de time: "fulano sai semana que vem, não pode ser dele"
• Roadmap futuro: "vai quebrar feature X que está em planning"

👤 O papel do humano

Claudex não substitui revisão humana. Substitui revisão humana ruim. Revisão boa de humano sênior continua valiosa — e complementa.

Divisão saudável de papéis:

• Claudex: pega 80% dos problemas técnicos comuns rapidamente
• Humano sênior: pega os 20% que dependem de contexto, história, política
• Resultado: mais qualidade, menos tempo do humano em revisão repetitiva

🤝 Combinando com revisão de código

O ciclo Claudex termina antes do código existir. Code review depois é complementar, não duplicado:

Claudex (antes)

Plano sólido. Riscos explícitos. Rollback definido. Critério de aceite claro.

Code review (depois)

Implementação fiel ao plano. Bugs sutis. Estilo. Testes.

O reviewer humano não precisa mais perguntar "esse plano faz sentido?" — só verifica "implementação fiel?". Code review fica mais rápido e focado.

📈 Limites de rodadas

Mais rodadas ≠ melhor plano. A partir da 5ª-6ª rodada, retorno cai bruscamente:

Rodada	Achados úteis novos	Repetições
R1	~5-10 (novidade alta)	0%
R2	~3-5 (foco em novo ângulo)	10-20%
R3	~2-3 (novo ângulo final)	20-30%
R4	~1-2 (refinamentos)	40-60%
R5+	0-1 (bizarro ou repetido)	70%+

Por isso o padrão é 3 — sweet spot entre cobertura e custo.

🎯 A filosofia final

"Antes de pedir para a IA construir, peça para ela provar que o plano aguenta ser construído."

Essa frase resume tudo. Mas o complemento honesto: o Claudex prova o plano contra problemas conhecidos. O resto continua sendo job humano.

📚 Os 3 níveis de defesa

1. Plano endurecido — Claudex faz isso (objetivo desta ferramenta).
2. Revisão humana de contexto — quem conhece o sistema, a empresa, a história. Insubstituível.
3. Testes em produção real — staged rollout, feature flags, observabilidade. Mesmo plano perfeito precisa de validação real.

Os 3 trabalham em camadas. Pular um = ficar exposto.

🎉 Você completou o iClaudex!

As 4 trilhas. 24 módulos. 144 tópicos. Você agora domina o Claudex de ponta a ponta.

✓

Trilha 1 — Fundamentos — você sabe o que é, por que existe, como o ciclo funciona.

✓

Trilha 2 — Arquitetura — você entende Stop Hook, YAML, Runner, personas, segurança.

✓

Trilha 3 — Uso — você instala, comanda, calibra, e tem 3 PLAN.md como template.

✓

Trilha 4 — Avançado — você customiza personas, debuga estado, mede ROI, conhece os limites.

🚀 E agora?

Use o Claudex no seu próximo projeto real. Comece pequeno (1 rodada num plano simples) e calibre a partir daí. Lembre-se da regra de bolso:

"Quanto maior a incerteza, maior o valor do Claudex."

← Anterior 🏠 Voltar à Landing