Voltar ao Nível Técnico
MÓDULO 4 NÍVEL TÉCNICO

Prompting Multimodal (Imagem e Vídeo)

Domine a arte de criar prompts para modelos multimodais. Aprenda a gerar, interpretar e controlar conteúdo visual com precisão técnica.

7
Tópicos
90
Minutos
12
Exercícios
1

Interpretação Multimodal de Prompts

Como os modelos processam diferentes tipos de entrada

Modelos multimodais representam uma evolução significativa na IA, capazes de processar e integrar informações de diferentes modalidades - texto, imagem, áudio e vídeo. Compreender como esses modelos interpretam entradas combinadas é fundamental para criar prompts eficazes.

Visão + Texto

  • • Análise de imagens com contexto
  • • OCR e extração de informações
  • • Descrição e interpretação visual
  • • Comparação de imagens

Áudio + Contexto

  • • Transcrição com análise de sentimento
  • • Identificação de falantes
  • • Extração de informações de áudio
  • • Análise de tom e emoção

Estratégia de Interpretação

Ao trabalhar com entradas multimodais, sempre forneça contexto claro sobre o que você espera que o modelo faça com cada tipo de entrada.

# Exemplo de prompt multimodal eficaz

[Imagem: captura de tela de dashboard]

Analise esta captura de tela de dashboard e:
1. Identifique os KPIs principais mostrados
2. Descreva tendências visíveis nos gráficos
3. Sugira 3 insights de negócio baseados nos dados

2

Prompts para Geração de Imagens

Estrutura e técnicas para criação visual

A geração de imagens via prompt é uma arte que combina descrição técnica com criatividade. A estrutura do prompt influencia diretamente a qualidade e relevância das imagens geradas.

Anatomia de um Prompt de Imagem

1
Sujeito Principal

O que ou quem está na imagem

2
Estilo Visual

Fotorrealista, ilustração, 3D, aquarela, etc.

3
Composição

Ângulo, enquadramento, perspectiva

4
Iluminação

Natural, estúdio, dramática, suave

5
Detalhes Técnicos

Resolução, qualidade, parâmetros específicos

Exemplo de Prompt Estruturado

// Sujeito

Uma cientista trabalhando em laboratório futurista,

// Estilo

estilo cyberpunk com influências de Syd Mead,

// Composição

plano médio, ângulo levemente baixo,

// Iluminação

iluminação neon roxa e azul, alto contraste,

// Técnico

8k, ultra detalhado, ray tracing

3

Prompts Negativos em Imagens

Controlando o que NÃO deve aparecer

Prompts negativos são tão importantes quanto os positivos na geração de imagens. Eles permitem excluir elementos indesejados, corrigir artefatos comuns e refinar a qualidade final.

Prompt Positivo

Retrato profissional, fundo neutro, iluminação de estúdio, alta resolução, foco nítido

Prompt Negativo

Deformações, mãos extras, dedos extras, olhos cruzados, desfocado, baixa qualidade, marca d'água

Categorias de Prompts Negativos

Qualidade Técnica

blurry, low resolution, pixelated, jpeg artifacts, noise, grainy, overexposed, underexposed

Anatomia e Proporções

extra limbs, missing fingers, deformed hands, unnatural poses, distorted faces, asymmetrical

Elementos Indesejados

watermark, signature, text overlay, frame, border, logo, username, cropped

Estilo Específico

cartoon (se quer realismo), realistic (se quer ilustração), anime, photobash, stock photo look

Dica Importante

Nem todos os modelos de geração de imagem suportam prompts negativos da mesma forma. Verifique a documentação específica de cada ferramenta (DALL-E, Midjourney, Stable Diffusion).

4

Consistência Visual

Mantendo identidade entre múltiplas gerações

Um dos maiores desafios em projetos visuais com IA é manter consistência entre múltiplas imagens. Seja para criar um personagem recorrente, uma série de ilustrações ou materiais de marca, a consistência é crucial.

Técnicas de Consistência

🎨 Style Reference

Use imagens de referência para estabelecer o estilo visual base e manter coerência em novas gerações.

📝 Prompt Templates

Crie templates de prompt reutilizáveis com elementos fixos e variáveis para cada nova imagem.

🔢 Seeds Fixas

Quando disponível, use a mesma seed para manter características similares entre variações.

📋 Character Sheets

Crie documentos de referência detalhados descrevendo cada elemento que deve permanecer consistente.

Exemplo: Template de Personagem

# Personagem: Maya

## Características Fixas:

- Cabelo: curto, preto, estilo pixie

- Olhos: amendoados, cor âmbar

- Estilo: cyberpunk casual

- Acessório: brinco de argola dourada

## Variáveis por Cena:

- Roupa: [INSERIR]

- Pose: [INSERIR]

- Cenário: [INSERIR]

5

Prompting para Vídeos

Adicionando a dimensão temporal

A geração de vídeo via IA adiciona complexidade significativa ao prompting, pois além dos elementos visuais estáticos, você precisa descrever movimento, transições e temporalidade.

Elementos de um Prompt de Vídeo

Movimento de Câmera

Pan, zoom, dolly, tracking shot, steadicam

Ação do Sujeito

Descreva o movimento: caminhando, correndo, gesticulando

Ritmo e Duração

Lento, rápido, time-lapse, slow motion

Atmosfera e Mood

Cinematográfico, documentário, onírico, energético

Exemplo de Prompt de Vídeo

Slow dolly shot

aproximando-se de uma xícara de café fumegante

em uma mesa de madeira rústica,

luz dourada de manhã

entrando pela janela,

partículas de poeira flutuando no ar,

estilo cinematográfico,

shallow depth of field, 24fps, filme 35mm

6

Storyboards via Prompt

Planejamento visual narrativo com IA

Storyboards são ferramentas essenciais para pré-visualização de projetos audiovisuais. Com IA, você pode criar rapidamente visualizações de cenas para validar conceitos antes da produção.

Workflow de Storyboard com IA

1
Definir Estrutura Narrativa

Divida sua história em cenas-chave e momentos dramáticos importantes

2
Criar Prompt Base

Estabeleça estilo visual, proporção e elementos recorrentes

3
Gerar Frames-Chave

Crie imagens para cada cena usando prompts específicos para enquadramento

4
Anotar e Organizar

Adicione notas de direção, diálogos e indicações técnicas

Exemplo: Prompt para Cena de Storyboard

// CENA 3 - REVELAÇÃO

Enquadramento: Close-up

Rosto da protagonista (Maya) em close,
expressão de surpresa mudando para determinação,
iluminação lateral dramática criando sombras,
fundo desfocado com luzes de néon,
aspect ratio 16:9, estilo storyboard cinematográfico,
traços limpos, preto e branco com toques de cor

Nota: Transição para cena 4 com zoom out

7

Aplicações Práticas

Casos de uso reais em diferentes indústrias

O prompting multimodal tem aplicações em diversas indústrias, desde marketing até educação. Conhecer esses casos de uso ajuda a identificar oportunidades em sua área.

🎨

Marketing & Publicidade

  • • Criação de assets para campanhas
  • • Mockups de produtos
  • • Variações de anúncios para A/B testing
  • • Conteúdo para redes sociais
🎬

Entretenimento

  • • Concept art para games
  • • Storyboards para filmes
  • • Character design iterativo
  • • Visualização de cenários
📚

Educação

  • • Ilustrações educativas
  • • Infográficos personalizados
  • • Material didático visual
  • • Representações históricas
🏢

Arquitetura & Design

  • • Visualização de projetos
  • • Mood boards automatizados
  • • Variações de design de interiores
  • • Renderizações rápidas

Exercício Prático Final

Escolha um projeto real da sua área de atuação e crie:

  1. Um prompt base com estilo visual definido
  2. Um prompt negativo apropriado para o contexto
  3. 3 variações de prompt para diferentes cenários
  4. Um template reutilizável para futuras gerações

💡 Dica: Comece com algo simples e vá adicionando complexidade gradualmente. Documente o que funciona e o que não funciona para criar seu próprio "playbook" de prompts visuais.

Módulo 3: Cadeias e Processos Módulo 5: Prompts de Sistema