📱 Formato 9:16 vs 16:9
1080×1920 é o formato nativo de TikTok, Reels e Shorts. Exige layout empilhado e pensamento diferente de cortes landscape.
📐 Safe zones do TikTok
- •Topo (0-250px): username, tempo, botão "seguir" da plataforma
- •Base (1550-1920px): caption, descrição, botão "mais"
- •Direita (900-1080px): stack de botões (like, comment, share, som)
- •Centro (250-1550px): sua área livre — coloque conteúdo crítico aqui
🗣️ Face-mode choreography
Dois modos de face-mode — alternar com intenção cria ritmo; ficar fixo em um faz o vídeo cansar.
Full-screen
Rosto ocupa tela inteira.
- •Ideal para hooks, momentos de ênfase
- •Cria proximidade emocional
- •Não compete com motion graphics
Bottom-half
Rosto na metade inferior, motion graphics na superior.
- •Ideal para explicar conceitos com visual support
- •Permite mostrar gráficos, tipografia, screenshots
- •Padrão mais usado em short-form educacional
💡 Regra prática
Alterne modes a cada 3-5s. Hooks: full-screen. Explicações: bottom-half. CTAs: full-screen.
🎵 Áudio-sync scene timing
Motion graphics que cola em beat de fala tem sensação de profissional. Motion fora do beat vira ruído visual e o espectador sente sem saber explicar.
📝 Workflow de sync
- Gere transcrição word-level:
npx hyperframes transcribe video.mp4 --json - Identifique palavras-chave onde motion entra/sai
- Use os timestamps dessas palavras como data-start/data-duration
- Teste no Studio — motion deve literalmente acender no "K" de "kinetic"
📝 Karaoke captions com transcribe
80% do consumo em feed é com áudio mudo. Sem legenda você perde 80% da audiência. Karaoke (palavra acende no tempo) força atenção.
🎤 Comando
npx hyperframes transcribe assets/talking-head.mp4 \
--model small.en \
--json \
--output assets/transcript.jsonRetorna JSON com start/end por palavra. Use para gerar spans com timing preciso na sua composição de legendas.
💡 Legibilidade
Máximo 3 palavras por "frame" de legenda. Text stroke escuro 2-3px para contraste. Font size ~60-80px em 1080×1920.
🎙️ TTS on-device com Kokoro
Kokoro-82M é TTS embarcado na CLI Hyperframes. Gera voz sintética localmente, sem API paga, sem mandar áudio para servidor externo.
🎤 Comando
npx hyperframes tts "Seu texto aqui" \
--voice am_adam \
--output assets/narration.wavVozes disponíveis: am_adam (masculina neutra), af_bella (feminina), am_michael, af_sky, etc. Ver --help.
⚠️ Limitações
- ✗Só inglês (por enquanto)
- ✗Emoção neutra — não consegue fazer hype ou whisper
- ✗Para narração principal de marca, grave com humano
✅ As 10 regras do /short-form-video
A skill /short-form-video encapsula um playbook testado em produção no may-shorts-19, o short mais polido do kit.
📋 As 10 regras
- Scroll-stop hook nos 2s iniciais
- Alterna full-screen ↔ bottom-half a cada 3-5s
- Motion graphics entra no beat exato da palavra-chave
- Karaoke captions obrigatórias (máx 3 palavras por frame)
- CTA explícito visual nos últimos 3s
- Outro com logo + handle social + URL
- Música de fundo sub-mixed (-18db) sob narração
- Cortes rápidos: média 1.2s por cena
- Cor signature aparece em pelo menos 3 cenas
- Callback ao hook inicial no outro
📋 Resumo do Módulo
Próxima Trilha:
Trilha 3 - Projetos Avançados (Promo SaaS + Projeto Final)