Modulo 4.8 - Verificacao e Prompts Auto-validantes

🧩 O que sao Prompts Auto-validantes

Um prompt auto-validante e um prompt que inclui seus proprios criterios de verificacao. Em vez de voce revisar manualmente se o Claude fez tudo certo, o prompt instrui o Claude a verificar o trabalho antes de declarar concluido. E como entregar uma tarefa com um checklist de aceite embutido.

🎯 Conceito Principal

A diferenca entre um prompt normal e um auto-validante:

// PROMPT NORMAL:

"Add input validation to the signup form."

// PROMPT AUTO-VALIDANTE:

"Add input validation to the signup form.

Before marking complete, verify:

□ Email format validated (regex + DNS check)

□ Password meets requirements (8+ chars, 1 upper,

1 number, 1 special)

□ Error messages are user-friendly (not technical)

□ XSS prevented on all inputs

□ Tests cover valid + 3 invalid scenarios

□ All existing tests still pass

Report status of each checkbox."

• Checklist explicito: O Claude sabe exatamente o que precisa estar pronto. Nao ha espaco para "esqueci de adicionar testes"
• "Report status": Pedir que o Claude reporte o status de cada item forca ele a verificar cada um antes de responder
• Reduz ciclos de revisao: Em vez de voce descobrir que faltou XSS prevention na review, o prompt ja exige isso antes de concluir
• Documenta expectativas: O checklist funciona como documentacao do que "pronto" significa para aquela tarefa especifica

💡 Dica Pratica

Crie checklists reutilizaveis para tipos comuns de tarefa. Um checklist para "nova feature", outro para "bug fix", outro para "endpoint de API". Guarde no CLAUDE.md ou como snippets. Com o tempo, seus prompts auto-validantes ficam instantaneos de escrever.

A frase "Before marking complete, verify" e a trigger. Sem ela, o Claude pode ou nao verificar. Com ela, ele SEMPRE verifica.

📏 Adicionando Criterios de Verificacao

Criterios de verificacao eficazes sao especificos, mensuráveis e verificaveis automaticamente. "Codigo deve ser bom" nao e um criterio. "Todos os testes passam e nao ha erros de lint" e um criterio. Neste topico, voce aprende a escrever criterios que realmente funcionam.

🎯 Conceito Principal

Os 4 tipos de criterios de verificacao e como escreve-los corretamente:

// 1. AUTOMATICOS (Claude pode verificar rodando comando)

□ `npm test` passes with 0 failures

□ `npm run lint` reports 0 errors

□ `npm run build` completes without errors

// 2. INSPECAO (Claude verifica lendo o codigo)

□ No hardcoded secrets or API keys

□ All new functions have JSDoc comments

□ Error messages are in Portuguese

// 3. COMPORTAMENTAIS (Claude verifica logicamente)

□ Empty list returns empty array, not null

□ Invalid email shows specific error message

□ Concurrent requests don't cause race conditions

// 4. NEGATIVOS (o que NAO deve existir)

□ No console.log statements in production code

□ No TODO comments left behind

□ No new npm dependencies added

• Automaticos sao os mais fortes: O Claude pode literalmente rodar o comando e ver se passa. Sem ambiguidade, sem interpretacao
• Inspecao funciona bem: O Claude le o codigo e verifica. Funciona para padroes visiveis como naming, comments e formatacao
• Negativos previnem regressoes: Dizer o que NAO deve existir e tao importante quanto o que deve. "No console.log" evita debug trash em producao

💡 Dica Pratica

Comece com criterios automaticos (testes e lint) e adicione 2-3 criterios de inspecao ou negativos relevantes para a tarefa. Nao exagere: 5-8 criterios por tarefa e o ideal. Mais que 10 diluiu o foco.

Para projetos com CI/CD, alinhe os criterios do prompt com os checks do pipeline. Se o CI roda lint + tests + build, seus criterios devem espelhar isso.

📋 Prompts com Checklists Embutidos

Checklists embutidos vao alem de criterios de verificacao. Eles guiam o Claude durante a execucao, nao so na verificacao final. Cada passo do checklist e uma etapa que o Claude deve completar e marcar, criando um rastro visivel do progresso.

🎯 Conceito Principal

Um prompt com checklist embutido tem tres secoes: tarefa, checklist de execucao e checklist de verificacao:

[Task description]

Execution checklist (do in order):

□ Step 1: [specific action]

□ Step 2: [specific action]

□ Step 3: [specific action]

□ Step 4: Run tests

Verification checklist (check after completion):

□ All tests pass

□ No lint errors

□ [domain-specific check]

Report: mark each item ✅ or ❌ with notes.

• Dois checklists separados: Execucao (durante) e verificacao (depois). Isso garante que o Claude segue o processo E valida o resultado
• Ordem importa: "Do in order" garante execucao sequencial. Util quando passo 2 depende de passo 1
• Report visual: Pedir marcacao com check/x cria um relatorio visual que voce pode escanear em segundos

💡 Dica Pratica

Use checklists embutidos para tarefas repetitivas que voce faz frequentemente. Setup de novo modulo, deployment checklist, code review checklist. Salve como template no CLAUDE.md e reuse com pequenas adaptacoes.

O report com marcacoes permite identificar rapidamente o que falhou. Se o Claude marca algo como x, voce sabe exatamente onde intervir, sem ler todo o output.

🔁 Loop de Verificacao Automatico

O loop de verificacao automatico e o nivel mais avancado de prompts auto-validantes. Em vez de verificar uma vez no final, voce instrui o Claude a verificar continuamente e corrigir automaticamente ate todos os criterios passarem. E como um pipeline de CI que roda ate ficar verde.

🎯 Conceito Principal

O prompt de loop de verificacao tem uma instrucao de repeticao ate satisfazer todos os criterios:

[Task description]

After implementation, run this verification loop:

1. Run `npm test` - if failures, fix and re-run

2. Run `npm run lint` - if errors, fix and re-run

3. Run `npm run build` - if errors, fix and re-run

4. Check: no hardcoded values, no console.logs

5. Check: all new code has error handling

Repeat until ALL checks pass.

Maximum 3 iterations. If still failing after 3,

report what's blocking and ask for guidance.

• Loop automatico: O Claude executa, verifica, corrige, verifica de novo. Voce recebe o resultado final ja validado
• Limite de iteracoes: "Maximum 3 iterations" previne loops infinitos. Se apos 3 tentativas ainda falha, provavelmente precisa de intervencao humana
• Fallback humano: "Report what's blocking and ask for guidance" garante que o Claude nao fica preso. Ele escala para voce quando necessario
• Ordem importa: Testes primeiro, lint depois, build por ultimo. Se os testes falham, nao adianta verificar lint

💡 Dica Pratica

O loop de verificacao funciona melhor com criterios automaticos (testes, lint, build). Para criterios de inspecao, use checklists em vez de loops, pois o Claude nao tem como "re-rodar" uma inspecao visual de forma diferente.

Em projetos com CI/CD, voce pode ir alem: "After all local checks pass, push to a feature branch and verify CI passes. If CI fails, fix locally and push again."

📊 Confidence Scoring (Asking Claude to Rate)

Confidence scoring e uma tecnica onde voce pede ao Claude para avaliar sua propria confianca no resultado. Isso revela areas de incerteza que voce pode revisar com mais atencao. Um Claude que diz "90% confiante" e mais confiavel do que um que diz "100% confiante" sobre uma tarefa complexa.

🎯 Conceito Principal

O prompt de confidence scoring pede auto-avaliacao por dimensao:

[After completing the task]

Rate your confidence (0-100%) on each dimension:

- Correctness: __% (does it do what was asked?)

- Completeness: __% (all edge cases covered?)

- Security: __% (no vulnerabilities?)

- Performance: __% (no bottlenecks?)

- Test coverage: __% (all paths tested?)

For any dimension below 85%, explain what's

uncertain and what would increase your confidence.

• Metacognicao forçada: Pedir ao Claude para se avaliar ativa o "thinking about thinking". Ele reconsidera o trabalho sob cada dimensao
• Threshold de 85%: Qualquer dimensao abaixo de 85% exige explicacao. Isso revela onde o Claude tem duvidas e onde voce deve focar sua revisao
• "What would increase confidence": Essa pergunta e ouro. O Claude pode dizer "testes de integracao aumentariam minha confianca em correctness" — e voce pode pedir que ele os escreva
• Calibracao com experiencia: Com o tempo, voce aprende como o Claude calibra suas notas. 95% geralmente e solido. 70% merece atencao imediata

💡 Dica Pratica

Combine confidence scoring com o loop de verificacao: "For any dimension below 85%, take action to increase it before declaring done." Isso transforma o scoring de diagnostico em acao corretiva automatica.

Desconfie de 100% em qualquer dimensao. Se o Claude diz 100% em seguranca para uma feature complexa, pode ser falta de pensamento critico, nao confianca real. Nesse caso, rode um Security Audit separado.

🔄 Sistema Completo de Prompts Validados

Agora vamos combinar tudo num sistema completo de prompts auto-validantes. Este e o workflow final da Trilha 4: um template universal que voce pode adaptar para qualquer tarefa, garantindo que o output do Claude sempre atende aos padroes de qualidade que voce definiu.

🎯 Conceito Principal

O template universal de prompt auto-validante combina outcome delegation, checklists e confidence scoring:

## Outcome

[What I want to achieve - declarative]

## Constraints

[What must NOT change, tech restrictions]

## Execution Steps

[Ordered checklist of what to do]

## Verification

[Automated checks + inspection checks]

Run verification loop (max 3 iterations).

## Confidence Report

Rate correctness, completeness, security (0-100%).

For any below 85%, take corrective action.

• 5 secoes claras: Outcome (o que), Constraints (limites), Execution (como), Verification (checagem), Confidence (auto-avaliacao). Cada secao tem um papel especifico
• Adaptavel: Para tarefas simples, use so Outcome + Verification. Para tarefas complexas, use o template completo. O framework e modular
• Documente no CLAUDE.md: Adicione o template como padrao do projeto. O Claude passara a seguir essa estrutura automaticamente em tarefas futuras

Este template encapsula toda a Trilha 4: Daily Drivers (modulo 4.1), Getting Started (4.2), Building (4.3), Testing (4.4), Quality (4.5), Architecture (4.6), Outcome Delegation (4.7) e agora Verificacao (4.8). Voce tem o sistema completo.

💡 Dica Pratica

Nao trate o template como rigido. Adapte para cada contexto. Um hotfix urgente precisa de Outcome + Verification rapidos. Uma feature critica precisa do template completo com 10+ criterios de verificacao. O objetivo e ter uma estrutura, nao uma prisao.

Com a conclusao deste modulo, voce domina a Trilha 4 completa. Da proxima vez que abrir o Claude Code, voce tera um arsenal de prompts profissionais que geram resultados de nivel senior, verificados e validados automaticamente.

✎

Exercicio Pratico

Criar 3 prompts com criterios de verificacao embutidos

Aplique tudo que aprendeu neste modulo para criar prompts auto-validantes completos:

1. Crie um prompt auto-validante para adicionar uma feature nova ao seu projeto. Use o template completo (Outcome, Constraints, Execution, Verification, Confidence)
2. Crie um prompt auto-validante para corrigir um bug. Inclua loop de verificacao com max 3 iteracoes
3. Crie um prompt auto-validante para refactoring seguro. Combine Refactor Guardrails (modulo 4.5) com checklists e confidence scoring
4. Rode os 3 prompts no Claude Code e observe como o Claude responde ao formato auto-validante
5. Salve os 3 templates no seu CLAUDE.md como prompts padrao do projeto

✅ Criterios de Sucesso

☐ Criou prompt auto-validante para feature nova

☐ Criou prompt com loop de verificacao para bug fix

☐ Criou prompt com confidence scoring para refactoring

☐ Rodou os 3 no Claude Code e observou resultados

☐ Salvou templates no CLAUDE.md do projeto

📋 Resumo do Modulo

✓

Prompts auto-validantes incluem criterios proprios - "Before marking complete, verify" ativa a auto-verificacao do Claude.

✓

4 tipos de criterios: automatico, inspecao, comportamental, negativo - Automaticos sao os mais fortes. Negativos previnem regressoes.

✓

Checklists embutidos guiam execucao e verificacao - Duas secoes: execution checklist (durante) e verification checklist (depois).

✓

Loop de verificacao automatiza fix-and-check - Max 3 iteracoes. Fallback humano se ainda falhar. CI/CD local no prompt.

✓

Confidence scoring revela areas de incerteza - 0-100% por dimensao. Abaixo de 85% exige acao corretiva. Desconfie de 100%.

✓

Template universal combina tudo da Trilha 4 - Outcome + Constraints + Execution + Verification + Confidence. Modular e adaptavel.

Proxima Trilha:

Trilha 5 - Custom Slash Commands e Skills

← Modulo Anterior Voltar para Trilha Proxima Trilha →