ComfyUI — Hub do Ecossistema Open-Source
Domine o ComfyUI, a interface node-based que se tornou o hub central para rodar modelos open-source de imagem e vídeo com controle total sobre cada etapa do pipeline.
🔧 O que é o ComfyUI?
O ComfyUI é uma interface gráfica node-based e open-source para rodar modelos de IA generativa. Enquanto ferramentas como Midjourney ou Runway oferecem uma experiência simplificada (digita prompt → recebe resultado), o ComfyUI expõe cada etapa do pipeline de geração como um nó visual que você pode configurar, conectar e customizar.
Pense nele como o "Blender da IA generativa" — poderoso, flexível, com curva de aprendizado, mas com possibilidades praticamente ilimitadas.
Por que o ComfyUI dominou?
Três razões: (1) é 100% gratuito e open-source, (2) suporta virtualmente qualquer modelo open-source via custom nodes, e (3) a comunidade criou mais de 1000 pacotes de custom nodes que estendem suas capacidades infinitamente.
📦 1000+ Custom Nodes
O ecossistema de custom nodes é o que torna o ComfyUI verdadeiramente poderoso. Cada pacote de nós adiciona novas funcionalidades:
| Pacote de Nós | Funcionalidade |
|---|---|
| ComfyUI-Wan | Integração com Wan 2.5/2.7 para geração de vídeo |
| ComfyUI-FLUX | Suporte ao FLUX.2 para imagens fotorrealísticas |
| ComfyUI-SkyReels | Pipeline SkyReels V4 para vídeo com áudio |
| Rodin3D Nodes | Geração de modelos 3D a partir de imagens |
| ControlNet Nodes | Controle de pose, profundidade, bordas e composição |
| LatentCut Node | Corte e composição no espaço latente (sem artefatos) |
| IP-Adapter Nodes | Transferência de estilo e consistência de personagem |
🧩 Subgraphs — Workflows Modulares
Os Subgraphs são uma funcionalidade avançada que permite encapsular workflows complexos em um único nó reutilizável. Isso possibilita:
- • Modularidade — Crie "blocos" que podem ser reutilizados em diferentes projetos
- • Organização — Mantenha workflows complexos legíveis e gerenciáveis
- • Compartilhamento — Exporte subgraphs para a comunidade ou equipe
- • Abstração — Esconda a complexidade e exponha apenas os parâmetros relevantes
🤖 ComfyUI Copilot (Alibaba)
O ComfyUI Copilot, desenvolvido pela Alibaba, é um assistente de IA integrado ao ComfyUI que acelera drasticamente a curva de aprendizado:
- • Geração de workflows por prompt — Descreva o que quer e o Copilot monta o workflow
- • Explicação de nós — Passe o mouse sobre qualquer nó e receba uma explicação detalhada
- • Debug assistido — O Copilot identifica e sugere correções para erros no workflow
- • 10x mais rápido — Segundo a Alibaba, o Copilot acelera o aprendizado do ComfyUI em 10 vezes
Como ativar o Copilot
Instale a extensão ComfyUI-Copilot via ComfyUI Manager. Após reiniciar, um ícone de chat aparece na interface. Você pode pedir: "Crie um workflow para gerar imagem com FLUX.2, aplicar ControlNet de pose, e fazer upscale 4x".
💾 Otimização de VRAM
Rodar modelos grandes localmente exige gerenciamento cuidadoso de VRAM. O ComfyUI oferece várias estratégias:
| Estratégia | Comando/Configuração | Economia de VRAM |
|---|---|---|
| FP16 Intermediates | --fp16-intermediates | ~30-40% |
| Low VRAM Mode | --lowvram | ~50% |
| CPU Offload | --cpu | Máxima (mais lento) |
| Tiled VAE | Nó VAE Decode (Tiled) | ~20% no decode |
Recomendação de hardware
Para geração de imagens com FLUX.2: mínimo 12GB VRAM (RTX 3060/4060). Para vídeo com Wan 2.7: mínimo 24GB VRAM (RTX 4090 ou A100). Com --fp16-intermediates, uma RTX 3090 (24GB) roda a maioria dos modelos confortavelmente.
🛠️ Configurando o ComfyUI localmente
Passo 1 — Instalar pré-requisitos
Python 3.10+, Git, CUDA toolkit (NVIDIA) ou ROCm (AMD). Verifique com nvidia-smi se sua GPU é reconhecida.
Passo 2 — Clonar o repositório
git clone https://github.com/comfyanonymous/ComfyUI.git
Passo 3 — Instalar dependências
pip install -r requirements.txt
Passo 4 — Baixar modelo FLUX.2
Baixe o modelo FLUX.2-schnell do Hugging Face e coloque em ComfyUI/models/checkpoints/
Passo 5 — Iniciar o ComfyUI
python main.py --fp16-intermediates
Acesse http://127.0.0.1:8188 no navegador.
🎨 Primeiro workflow: Text-to-Image com FLUX.2
Crie seu primeiro workflow conectando estes nós na ordem:
[Load Checkpoint: FLUX.2] → [CLIP Text Encode: seu prompt] → [KSampler] → [VAE Decode] → [Save Image]
- 1. Load Checkpoint — Selecione o modelo FLUX.2 que você baixou
- 2. CLIP Text Encode — Adicione dois: um para prompt positivo, outro para prompt negativo
- 3. KSampler — Configure steps (20), cfg (7.5), sampler (euler), scheduler (normal)
- 4. VAE Decode — Converte o espaço latente em imagem visível
- 5. Save Image — Salva o resultado como PNG