Pipeline de vídeo com IA · v5

Baixar, transcrever, traduzir e dublar vídeos

Pipeline completo de processamento de vídeo com IA. Modelos locais e na nuvem, interface web com monitor em tempo real e suporte a GPU via Docker.

# Subir tudo de uma vez
./start.sh
# API: http://localhost:8000
# Web: http://localhost:3000
O que é

Um pipeline, do download ao clip final

O Dublar Pro v5 encadeia download, transcrição, tradução, dublagem e corte de vídeos. Frontend Next.js, backend FastAPI e pipelines Python que rodam como subprocess; com suporte a GPU via Docker para os modelos pesados.

🎬 Dublagem em 10 etapas

Traduz e dubla vídeos com IA usando TTS Edge, Bark, XTTS (clone de voz) ou Piper, com sync mode e diarização.

🎬 Transcrição e corte

Legendas SRT/TXT/JSON com Whisper ou Parakeet, e corte por timestamps ou momentos virais detectados por LLM.

🎬 Local ou nuvem

Tradução com M2M100 (offline) ou Ollama, e LLMs locais ou em nuvem (OpenAI, Anthropic, Groq, DeepSeek, OpenRouter).

Como funciona

Frontend, API e pipelines em camadas

O frontend fala com a API FastAPI via REST + WebSocket; a API executa os pipelines Python (montados como volume no Docker) que acionam os motores de IA. Cada job reporta progresso por etapa, ETA e logs ao vivo.

Baixar Transcrever Traduzir Dublar Cortar

Frontend Next.js (:3000)

Dashboard, páginas de Dublar/Transcrever/Cortar/Baixar e lista de jobs com filtros por tipo e status.

Backend FastAPI (:8000)

Job Manager, Model Manager, System Monitor e WebSocket; aciona os scripts via subprocess no Docker.

Motores de IA

ASR Whisper large-v3 / Parakeet 1.1B, TTS Edge/Bark/XTTS/Piper, tradução M2M100/Ollama e LLMs locais ou na nuvem.

Pré-requisitos

O que você precisa antes de começar

O Dublar Pro v5 usa Python no backend/pipelines e Node no frontend; a opção recomendada para os modelos pesados é Docker com GPU.

Python + FastAPI

Backend e pipelines em Python. Instale as dependências da API.

# dependências da API
pip install fastapi "uvicorn[standard]" websockets httpx python-multipart

Node.js (frontend)

Frontend Next.js na porta 3000 via npm.

# instalar a web
cd web && npm install

Docker GPU (recomendado)

Para rodar os pipelines com aceleração de GPU.

# build da imagem do pipeline
docker build -t dublar-pro:gpu .
Guia de uso · passo a passo

Rodando o Dublar Pro v5

Use o script de inicialização para subir tudo, ou rode backend e frontend manualmente. Também há comandos de CLI para cada etapa.

1

Clone o repositório

Baixe o código e entre na pasta.

git clone https://github.com/inematds/dublarv5.git
cd dublarv5
2

Suba tudo com o start.sh

Inicia API (:8000) e web (:3000) de uma vez.

./start.sh  # API :8000 · Web :3000
3

Ou inicie manualmente

Backend FastAPI e frontend Next.js em processos separados.

uvicorn api.server:app --host 0.0.0.0 --port 8000 --reload &
cd web && npm install && npm run dev -- -p 3000 -H 0.0.0.0 &
4

Use pela interface web

Abra o dashboard e dispare jobs de Dublar, Transcrever, Cortar ou Baixar, acompanhando o progresso em tempo real.

# abra no navegador
http://localhost:3000
5

Dublar pela CLI

Traduza e duble um vídeo direto da URL, escolhendo idioma e motor TTS.

python dublar_pro_v5.py --in "https://youtube.com/watch?v=ID" --tgt pt --tts edge
6

Transcrever e cortar pela CLI

Gere legendas e extraia clips manuais ou virais.

python transcrever_v1.py --in video.mp4 --outdir ./transcription --whisper-model large-v3
python clipar_v1.py --in video.mp4 --mode viral --ollama-model qwen2.5:7b --num-clips 5
Exemplos

O que dá pra fazer

Casos típicos cobertos pelo pipeline, do download ao clip pronto pra publicar.

Dublar um vídeo inteiro

Pipeline de 10 etapas que baixa, transcreve, traduz e dubla, com sync mode, diarização e escolha de motor TTS.

Legendar com precisão

Transcreva com Whisper large-v3 ou Parakeet e exporte em SRT, TXT ou JSON para qualquer editor.

Gerar cortes virais

No modo viral, um LLM analisa a transcrição e identifica os melhores trechos; baixe individualmente ou em ZIP.

Baixar de +1000 sites

Baixe de YouTube, TikTok, Instagram, Facebook, Twitter/X e Twitch na qualidade desejada ou só o áudio em MP3.

Roadmap

Onde o Dublar Pro v5 está e para onde vai

O pipeline já entrega o fluxo completo de vídeo. Os próximos passos ampliam motores e robustez.

Pronto
Pipeline completoBaixar, transcrever, traduzir, dublar e cortar — via interface web com monitor de jobs em tempo real.
v5.3
Página de downloadDownload direto de +1000 sites com escolha de qualidade e player inline ao concluir.
Em foco
GPU via DockerImagem dedicada para rodar os pipelines com aceleração de GPU em produção.
Próximo
Mais motores e providersNovos motores de TTS/ASR e mais providers de LLM para tradução e cortes virais.