2.1
GA
~55 min · Intermediário · Prático
✉️ Estrutura da mensagem: system, few-shot, XML/JSON, ancoragem
A anatomia de um prompt bem-engenhado: 5 seções estáveis, formato declarativo, exemplos few-shot e por que ancoragem do user turn no fim importa.
1 🎭 System prompt: persona e regras ▾
O que é: Mensagem do tipo 'system' que define persona, regras, formato de saída e restrições. Estável entre turns — alvo prioritário do prompt caching.
Por que aprender: Sem system prompt explícito, o modelo improvisa o comportamento a cada chamada. Você perde controle e reprodutibilidade.
Conceitos-chave: Persona, role, regras, formato de saída, prompt cache anchor.
2 📚 Few-shot: ensinando por exemplo ▾
O que é: Padrão de incluir 2-N exemplos input→output no prompt para guiar o modelo. Funciona melhor que descrição abstrata para tarefas com formato específico.
Por que aprender: In-context learning: o modelo extrapola do padrão dos exemplos. Para classificação, extração estruturada e tradução, few-shot consistentemente bate zero-shot.
Conceitos-chave: In-context learning, GPT-3 paper (Brown et al. 2020), exemplo canônico, ordem dos exemplos.
3 🏷️ Formato declarativo: XML, JSON, Markdown ▾
O que é: Usar tags XML (
<documento>, <pergunta>) ou JSON Schema declara seções e ajuda o modelo a separá-las.Por que aprender: Modelos modernos foram fine-tunados em prompts com estrutura. XML reduz confusão entre 'o que é instrução' e 'o que é dado'.
Conceitos-chave: XML tags, JSON Schema, structured outputs, delimitadores.
4 📍 Ordem das seções: estável → variável → instrução ▾
O que é: System prompt e few-shot fixos primeiro (cacheáveis); contexto recuperado depois (variável); instrução do usuário no fim.
Por que aprender: Maximiza cache hit rate e coloca a pergunta na zona de atenção alta (recência).
Conceitos-chave: Cache stability, instruction-at-end, anchoring, prefix-suffix split.
5 🪢 Ancoragem: repita a pergunta antes E depois ▾
O que é: Quando o contexto recuperado é grande, repetir a pergunta no início E no fim do bloco de contexto reduz a chance de o modelo esquecer.
Por que aprender: Liu et al. (2023) mostra que info no meio é menos atendida. Ancoragem é uma das mitigações validadas.
Conceitos-chave: Anchoring, repetition prompt, query injection.
6 🔧 Chain-of-thought: pensar antes de responder ▾
O que é: Padrão de pedir ao modelo para 'pensar passo a passo' antes da resposta final. Tags como
<raciocinio> antes de <resposta>.Por que aprender: Em problemas multi-passo (matemática, lógica), CoT melhora acurácia significativamente. Wei et al. (2022).
Conceitos-chave: CoT (Wei 2022), zero-shot CoT (Kojima 2022), reasoning models, scratchpad.