MÓDULO 2.3

📱 Short-form vertical com talking-head

Produzir short 9:16 estilo TikTok/Reels/Shorts com rosto + motion graphics sincronizado + legendas karaokê geradas com npx hyperframes transcribe.

6
Tópicos
60
Minutos
Intermed.
Nível
Prática
Tipo
1

📱 Formato 9:16 vs 16:9

1080×1920 é o formato nativo de TikTok, Reels e Shorts. Exige layout empilhado e pensamento diferente de cortes landscape.

📐 Safe zones do TikTok

  • Topo (0-250px): username, tempo, botão "seguir" da plataforma
  • Base (1550-1920px): caption, descrição, botão "mais"
  • Direita (900-1080px): stack de botões (like, comment, share, som)
  • Centro (250-1550px): sua área livre — coloque conteúdo crítico aqui
2

🗣️ Face-mode choreography

Dois modos de face-mode — alternar com intenção cria ritmo; ficar fixo em um faz o vídeo cansar.

Full-screen

Rosto ocupa tela inteira.

  • Ideal para hooks, momentos de ênfase
  • Cria proximidade emocional
  • Não compete com motion graphics

Bottom-half

Rosto na metade inferior, motion graphics na superior.

  • Ideal para explicar conceitos com visual support
  • Permite mostrar gráficos, tipografia, screenshots
  • Padrão mais usado em short-form educacional

💡 Regra prática

Alterne modes a cada 3-5s. Hooks: full-screen. Explicações: bottom-half. CTAs: full-screen.

3

🎵 Áudio-sync scene timing

Motion graphics que cola em beat de fala tem sensação de profissional. Motion fora do beat vira ruído visual e o espectador sente sem saber explicar.

📝 Workflow de sync

  1. Gere transcrição word-level: npx hyperframes transcribe video.mp4 --json
  2. Identifique palavras-chave onde motion entra/sai
  3. Use os timestamps dessas palavras como data-start/data-duration
  4. Teste no Studio — motion deve literalmente acender no "K" de "kinetic"
4

📝 Karaoke captions com transcribe

80% do consumo em feed é com áudio mudo. Sem legenda você perde 80% da audiência. Karaoke (palavra acende no tempo) força atenção.

🎤 Comando

npx hyperframes transcribe assets/talking-head.mp4 \
  --model small.en \
  --json \
  --output assets/transcript.json

Retorna JSON com start/end por palavra. Use para gerar spans com timing preciso na sua composição de legendas.

💡 Legibilidade

Máximo 3 palavras por "frame" de legenda. Text stroke escuro 2-3px para contraste. Font size ~60-80px em 1080×1920.

5

🎙️ TTS on-device com Kokoro

Kokoro-82M é TTS embarcado na CLI Hyperframes. Gera voz sintética localmente, sem API paga, sem mandar áudio para servidor externo.

🎤 Comando

npx hyperframes tts "Seu texto aqui" \
  --voice am_adam \
  --output assets/narration.wav

Vozes disponíveis: am_adam (masculina neutra), af_bella (feminina), am_michael, af_sky, etc. Ver --help.

⚠️ Limitações

  • Só inglês (por enquanto)
  • Emoção neutra — não consegue fazer hype ou whisper
  • Para narração principal de marca, grave com humano
6

✅ As 10 regras do /short-form-video

A skill /short-form-video encapsula um playbook testado em produção no may-shorts-19, o short mais polido do kit.

📋 As 10 regras

  1. Scroll-stop hook nos 2s iniciais
  2. Alterna full-screen ↔ bottom-half a cada 3-5s
  3. Motion graphics entra no beat exato da palavra-chave
  4. Karaoke captions obrigatórias (máx 3 palavras por frame)
  5. CTA explícito visual nos últimos 3s
  6. Outro com logo + handle social + URL
  7. Música de fundo sub-mixed (-18db) sob narração
  8. Cortes rápidos: média 1.2s por cena
  9. Cor signature aparece em pelo menos 3 cenas
  10. Callback ao hook inicial no outro

📋 Resumo do Módulo

Formato 9:16 dominado — safe zones do TikTok respeitadas
Face-mode choreography — alternância full-screen ↔ bottom-half
Motion cola em beat — timestamps de palavras-chave usados
Karaoke captions gerados — transcribe + highlight por palavra
TTS local (Kokoro) usado — sem API paga
10 regras do /short-form-video aplicadas — checklist da skill respeitado

Próxima Trilha:

Trilha 3 - Projetos Avançados (Promo SaaS + Projeto Final)