Módulo 2.3 - Short-form Vertical | Design + Vídeo com IA

📱 Formato 9:16 vs 16:9

1080×1920 é o formato nativo de TikTok, Reels e Shorts. Exige layout empilhado e pensamento diferente de cortes landscape.

📐 Safe zones do TikTok

•Topo (0-250px): username, tempo, botão "seguir" da plataforma
•Base (1550-1920px): caption, descrição, botão "mais"
•Direita (900-1080px): stack de botões (like, comment, share, som)
•Centro (250-1550px): sua área livre — coloque conteúdo crítico aqui

🗣️ Face-mode choreography

Dois modos de face-mode — alternar com intenção cria ritmo; ficar fixo em um faz o vídeo cansar.

Full-screen

Rosto ocupa tela inteira.

•Ideal para hooks, momentos de ênfase
•Cria proximidade emocional
•Não compete com motion graphics

Bottom-half

Rosto na metade inferior, motion graphics na superior.

•Ideal para explicar conceitos com visual support
•Permite mostrar gráficos, tipografia, screenshots
•Padrão mais usado em short-form educacional

💡 Regra prática

Alterne modes a cada 3-5s. Hooks: full-screen. Explicações: bottom-half. CTAs: full-screen.

🎵 Áudio-sync scene timing

Motion graphics que cola em beat de fala tem sensação de profissional. Motion fora do beat vira ruído visual e o espectador sente sem saber explicar.

📝 Workflow de sync

Gere transcrição word-level: npx hyperframes transcribe video.mp4 --json
Identifique palavras-chave onde motion entra/sai
Use os timestamps dessas palavras como data-start/data-duration
Teste no Studio — motion deve literalmente acender no "K" de "kinetic"

📝 Karaoke captions com transcribe

80% do consumo em feed é com áudio mudo. Sem legenda você perde 80% da audiência. Karaoke (palavra acende no tempo) força atenção.

🎤 Comando

npx hyperframes transcribe assets/talking-head.mp4 \
  --model small.en \
  --json \
  --output assets/transcript.json

Retorna JSON com start/end por palavra. Use para gerar spans com timing preciso na sua composição de legendas.

💡 Legibilidade

Máximo 3 palavras por "frame" de legenda. Text stroke escuro 2-3px para contraste. Font size ~60-80px em 1080×1920.

🎙️ TTS on-device com Kokoro

Kokoro-82M é TTS embarcado na CLI Hyperframes. Gera voz sintética localmente, sem API paga, sem mandar áudio para servidor externo.

🎤 Comando

npx hyperframes tts "Seu texto aqui" \
  --voice am_adam \
  --output assets/narration.wav

Vozes disponíveis: am_adam (masculina neutra), af_bella (feminina), am_michael, af_sky, etc. Ver --help.

⚠️ Limitações

✗Só inglês (por enquanto)
✗Emoção neutra — não consegue fazer hype ou whisper
✗Para narração principal de marca, grave com humano

✅ As 10 regras do /short-form-video

A skill /short-form-video encapsula um playbook testado em produção no may-shorts-19, o short mais polido do kit.

📋 As 10 regras

Scroll-stop hook nos 2s iniciais
Alterna full-screen ↔ bottom-half a cada 3-5s
Motion graphics entra no beat exato da palavra-chave
Karaoke captions obrigatórias (máx 3 palavras por frame)
CTA explícito visual nos últimos 3s
Outro com logo + handle social + URL
Música de fundo sub-mixed (-18db) sob narração
Cortes rápidos: média 1.2s por cena
Cor signature aparece em pelo menos 3 cenas
Callback ao hook inicial no outro

📋 Resumo do Módulo

✓

Formato 9:16 dominado — safe zones do TikTok respeitadas

✓

Face-mode choreography — alternância full-screen ↔ bottom-half

✓

Motion cola em beat — timestamps de palavras-chave usados

✓

Karaoke captions gerados — transcribe + highlight por palavra

✓

TTS local (Kokoro) usado — sem API paga

✓

10 regras do /short-form-video aplicadas — checklist da skill respeitado

Próxima Trilha:

Trilha 3 - Projetos Avançados (Promo SaaS + Projeto Final)

← Módulo Anterior Próxima Trilha →