🤖 Limitações do modelo
Codex e Claude são modelos de linguagem. Têm pontos cegos previsíveis:
- • Não conhecem seu contexto interno: só veem o que está no PLAN.md e nos arquivos passados
- • Podem alucinar APIs/libs: sugerir algo que não existe (verifique sempre)
- • Sem dados em tempo real: não sabem performance, métricas, incidentes recentes
- • Conhecimento limitado por data: mudanças recentes em frameworks podem não estar no cutoff
- • Não rodam código: análise estática, sem benchmarks reais
🔍 Riscos não detectáveis
Coisas que o Claudex não vê — e você precisa fazer revisão humana paralela:
- • Política de empresa: "não usamos provider X por contrato"
- • História do código: "última vez que mexemos aqui, quebrou Y"
- • Conhecimento tribal: "esse sistema foi pensado pra A, não B"
- • Compliance específico: regulamentação setorial muito específica
- • Dinâmica de time: "fulano sai semana que vem, não pode ser dele"
- • Roadmap futuro: "vai quebrar feature X que está em planning"
👤 O papel do humano
Claudex não substitui revisão humana. Substitui revisão humana ruim. Revisão boa de humano sênior continua valiosa — e complementa.
Divisão saudável de papéis:
- • Claudex: pega 80% dos problemas técnicos comuns rapidamente
- • Humano sênior: pega os 20% que dependem de contexto, história, política
- • Resultado: mais qualidade, menos tempo do humano em revisão repetitiva
🤝 Combinando com revisão de código
O ciclo Claudex termina antes do código existir. Code review depois é complementar, não duplicado:
Claudex (antes)
Plano sólido. Riscos explícitos. Rollback definido. Critério de aceite claro.
Code review (depois)
Implementação fiel ao plano. Bugs sutis. Estilo. Testes.
O reviewer humano não precisa mais perguntar "esse plano faz sentido?" — só verifica "implementação fiel?". Code review fica mais rápido e focado.
📈 Limites de rodadas
Mais rodadas ≠ melhor plano. A partir da 5ª-6ª rodada, retorno cai bruscamente:
| Rodada | Achados úteis novos | Repetições |
|---|---|---|
| R1 | ~5-10 (novidade alta) | 0% |
| R2 | ~3-5 (foco em novo ângulo) | 10-20% |
| R3 | ~2-3 (novo ângulo final) | 20-30% |
| R4 | ~1-2 (refinamentos) | 40-60% |
| R5+ | 0-1 (bizarro ou repetido) | 70%+ |
Por isso o padrão é 3 — sweet spot entre cobertura e custo.
🎯 A filosofia final
"Antes de pedir para a IA construir, peça para ela provar que o plano aguenta ser construído."
Essa frase resume tudo. Mas o complemento honesto: o Claudex prova o plano contra problemas conhecidos. O resto continua sendo job humano.
📚 Os 3 níveis de defesa
- 1. Plano endurecido — Claudex faz isso (objetivo desta ferramenta).
- 2. Revisão humana de contexto — quem conhece o sistema, a empresa, a história. Insubstituível.
- 3. Testes em produção real — staged rollout, feature flags, observabilidade. Mesmo plano perfeito precisa de validação real.
Os 3 trabalham em camadas. Pular um = ficar exposto.
🎉 Você completou o iClaudex!
As 4 trilhas. 24 módulos. 144 tópicos. Você agora domina o Claudex de ponta a ponta.
🚀 E agora?
Use o Claudex no seu próximo projeto real. Comece pequeno (1 rodada num plano simples) e calibre a partir daí. Lembre-se da regra de bolso:
"Quanto maior a incerteza, maior o valor do Claudex."