MODULO 1.6

๐ŸŽฏ Sensibilidade de Prompts

Entenda como pequenas mudancas na formulacao de prompts podem levar a resultados drasticamente diferentes - e como usar isso a seu favor.

6
Topicos
20
Minutos
Basico
Nivel
Teoria
Tipo
1

๐Ÿ” O que e Sensibilidade?

Sensibilidade de prompts refere-se ao fato de que pequenas mudancas na formulacao - uma palavra diferente, uma virgula, a ordem das frases - podem levar a outputs completamente diferentes. Isso e tanto um desafio quanto uma oportunidade.

๐Ÿ’ก Exemplo Classico

Veja como a mesma pergunta formulada de formas diferentes gera outputs distintos:

"Tell me about AI ethics"

โ†’ Resposta estilo academico, formal

"Explain AI ethics to me"

โ†’ Resposta estilo tutorial, didatico ("explain" e trigger word)

"What are the ethics of AI?"

โ†’ Resposta em lista, bullet points

"AI ethics: an overview"

โ†’ Resposta estilo sumario, overview estruturado

2

โšก Trigger Words

Certas palavras ativam modos especificos nos modelos. Trigger words sao como comandos implicitos que alteram o comportamento da resposta.

Trigger Word Comportamento Ativado Quando Usar
"Explain" Modo professor/tutorial Aprendizado, documentacao
"List" Modo bullet points Resumos, opcoes, features
"Step by step" Modo sequencial numerado Tutoriais, procedimentos
"Compare" Modo tabela/contraste Analise de opcoes
"Briefly" Modo conciso Respostas rapidas
"In detail" Modo expansivo Analises profundas

๐Ÿ’ก Dica Importante

"Step by step" e especialmente poderoso mesmo em modelos nao-reasoning. Ao pedir raciocinio passo a passo, voce reduz significativamente hallucinations porque o modelo e forcado a mostrar o trabalho.

3

๐Ÿ”„ Prompt Drift

Prompt drift e o fenomeno onde um prompt que funcionava perfeitamente para de funcionar apos updates no modelo. E uma realidade inevitavel ao trabalhar com LLMs - eles mudam, e seus prompts precisam evoluir junto.

๐Ÿšจ O Problema

So porque funciona hoje, nao significa que vai funcionar amanha.

  • โ€ข Modelos recebem updates silenciosos regularmente
  • โ€ข A "personalidade" pode mudar entre versoes
  • โ€ข Performance em tarefas especificas pode variar

โœ“ Estrategias de Mitigacao

  • โœ“ Prompt Testing: Teste variacoes regularmente
  • โœ“ Versionamento: Mantenha historico dos prompts que funcionam
  • โœ“ Prompts Evergreen: Foque em estruturas robutas, menos dependentes de quirks
  • โœ“ Model Pinning: Em producao, fixe versoes especificas quando possivel
4

๐Ÿงช Prompt Testing

Profissionais de prompt engineering tratam prompts como codigo: testam, iteram, e validam antes de colocar em producao.

๐ŸŽฏ Metodologia de Teste

1
Crie 5-10 variacoes do prompt

Mude palavras-chave, ordem, estrutura

2
Teste com diferentes temperatures

0.2, 0.5, 0.8 - veja qual gera resultados mais consistentes

3
Teste em diferentes modelos da familia

Claude 3.5, 3.7, Haiku - ou GPT-4o, 4.5, etc.

4
Identifique a configuracao mais robusta

Qual combinacao funciona bem em mais cenarios?

๐Ÿ“Š Por que Testar em Multiplos Modelos?

Ao testar em Claude 3.5, 3.7, e Haiku, voce identifica prompts que sao estruturalmente robustos vs prompts que dependem de quirks especificos de uma versao. Prompts robustos sofrem menos com drift.

5

๐Ÿ“‹ Estrategias de Mitigacao

Alem do prompt testing, existem outras estrategias para criar prompts mais resilientes a sensibilidade.

๐ŸŽฏ Seja Especifico

Ambiguidade e inimiga da consistencia. Quanto mais especifico, menos espaco para interpretacao.

โŒ "Escreva algo sobre vendas"

โœ“ "Escreva 3 bullet points sobre as vendas do Q4 2025, focando em crescimento percentual"

๐Ÿ“ Formato Consistente

Use sempre a mesma estrutura nos seus prompts. Consistencia gera previsibilidade.

Sempre use:

โ€ข Mesmo padrao de headers

โ€ข Mesma ordem de secoes

โ€ข Mesmos delimitadores

๐Ÿ”„ System Instructions

Use system prompts para definir comportamentos globais que persistem ao longo da conversa.

System instructions definem o "modo de operacao" base do modelo, reduzindo variabilidade.

๐Ÿงช Consistency Checks

Periodicamente re-teste seus prompts para detectar drift antes que cause problemas.

Crie uma suite de testes com inputs e outputs esperados. Rode semanalmente ou apos updates.

6

๐Ÿ”ง Exercicio Pratico

Vamos explorar sensibilidade na pratica para entender como pequenas mudancas afetam outputs.

๐Ÿ“ Desafio: Teste de Sensibilidade

Tarefa: Teste estas 4 variacoes do mesmo pedido e compare os resultados:

1. "Write an email to my boss asking for vacation"

2. "Draft a vacation request email to my manager"

3. "Compose a formal email requesting time off"

4. "Help me ask my boss for vacation in an email"

Observe: Tom, tamanho, formalidade, estrutura de cada resposta.

๐Ÿ’ก O que Voce Deve Notar

  • "Write" tende a ser mais direto
  • "Draft" pode incluir mais opcoes ou versoes
  • "Compose formal" sera mais cerimonioso
  • "Help me" pode ser mais conversacional e incluir explicacoes

๐Ÿ“‹ Resumo do Modulo

โœ“
Sensibilidade - Pequenas mudancas = grandes diferencas no output
โœ“
Trigger Words - "Explain", "list", "step by step" ativam modos especificos
โœ“
Prompt Drift - O que funciona hoje pode nao funcionar amanha
โœ“
Prompt Testing - Teste variacoes em diferentes modelos e temperatures
โœ“
Especificidade - Quanto mais especifico, mais consistente

Proximo Modulo:

1.7 - Comparacao de Modelos: GPT vs Claude vs Gemini - pontos fortes e fracos