Nível 2 ~120 min

ComfyUI — Hub do Ecossistema Open-Source

Domine o ComfyUI, a interface node-based que se tornou o hub central para rodar modelos open-source de imagem e vídeo com controle total sobre cada etapa do pipeline.

🔧 O que é o ComfyUI?

O ComfyUI é uma interface gráfica node-based e open-source para rodar modelos de IA generativa. Enquanto ferramentas como Midjourney ou Runway oferecem uma experiência simplificada (digita prompt → recebe resultado), o ComfyUI expõe cada etapa do pipeline de geração como um nó visual que você pode configurar, conectar e customizar.

Pense nele como o "Blender da IA generativa" — poderoso, flexível, com curva de aprendizado, mas com possibilidades praticamente ilimitadas.

Por que o ComfyUI dominou?

Três razões: (1) é 100% gratuito e open-source, (2) suporta virtualmente qualquer modelo open-source via custom nodes, e (3) a comunidade criou mais de 1000 pacotes de custom nodes que estendem suas capacidades infinitamente.

📦 1000+ Custom Nodes

O ecossistema de custom nodes é o que torna o ComfyUI verdadeiramente poderoso. Cada pacote de nós adiciona novas funcionalidades:

Pacote de Nós	Funcionalidade
ComfyUI-Wan	Integração com Wan 2.5/2.7 para geração de vídeo
ComfyUI-FLUX	Suporte ao FLUX.2 para imagens fotorrealísticas
ComfyUI-SkyReels	Pipeline SkyReels V4 para vídeo com áudio
Rodin3D Nodes	Geração de modelos 3D a partir de imagens
ControlNet Nodes	Controle de pose, profundidade, bordas e composição
LatentCut Node	Corte e composição no espaço latente (sem artefatos)
IP-Adapter Nodes	Transferência de estilo e consistência de personagem

🧩 Subgraphs — Workflows Modulares

Os Subgraphs são uma funcionalidade avançada que permite encapsular workflows complexos em um único nó reutilizável. Isso possibilita:

• Modularidade — Crie "blocos" que podem ser reutilizados em diferentes projetos
• Organização — Mantenha workflows complexos legíveis e gerenciáveis
• Compartilhamento — Exporte subgraphs para a comunidade ou equipe
• Abstração — Esconda a complexidade e exponha apenas os parâmetros relevantes

🤖 ComfyUI Copilot (Alibaba)

O ComfyUI Copilot, desenvolvido pela Alibaba, é um assistente de IA integrado ao ComfyUI que acelera drasticamente a curva de aprendizado:

• Geração de workflows por prompt — Descreva o que quer e o Copilot monta o workflow
• Explicação de nós — Passe o mouse sobre qualquer nó e receba uma explicação detalhada
• Debug assistido — O Copilot identifica e sugere correções para erros no workflow
• 10x mais rápido — Segundo a Alibaba, o Copilot acelera o aprendizado do ComfyUI em 10 vezes

Como ativar o Copilot

Instale a extensão ComfyUI-Copilot via ComfyUI Manager. Após reiniciar, um ícone de chat aparece na interface. Você pode pedir: "Crie um workflow para gerar imagem com FLUX.2, aplicar ControlNet de pose, e fazer upscale 4x".

💾 Otimização de VRAM

Rodar modelos grandes localmente exige gerenciamento cuidadoso de VRAM. O ComfyUI oferece várias estratégias:

Estratégia	Comando/Configuração	Economia de VRAM
FP16 Intermediates	--fp16-intermediates	~30-40%
Low VRAM Mode	--lowvram	~50%
CPU Offload	--cpu	Máxima (mais lento)
Tiled VAE	Nó VAE Decode (Tiled)	~20% no decode

Recomendação de hardware

Para geração de imagens com FLUX.2: mínimo 12GB VRAM (RTX 3060/4060). Para vídeo com Wan 2.7: mínimo 24GB VRAM (RTX 4090 ou A100). Com --fp16-intermediates, uma RTX 3090 (24GB) roda a maioria dos modelos confortavelmente.

🛠️ Configurando o ComfyUI localmente

Passo 1 — Instalar pré-requisitos

Python 3.10+, Git, CUDA toolkit (NVIDIA) ou ROCm (AMD). Verifique com nvidia-smi se sua GPU é reconhecida.

Passo 2 — Clonar o repositório

git clone https://github.com/comfyanonymous/ComfyUI.git

Passo 3 — Instalar dependências

pip install -r requirements.txt

Passo 4 — Baixar modelo FLUX.2

Baixe o modelo FLUX.2-schnell do Hugging Face e coloque em ComfyUI/models/checkpoints/

Passo 5 — Iniciar o ComfyUI

python main.py --fp16-intermediates

Acesse http://127.0.0.1:8188 no navegador.

🎨 Primeiro workflow: Text-to-Image com FLUX.2

Crie seu primeiro workflow conectando estes nós na ordem:

[Load Checkpoint: FLUX.2] → [CLIP Text Encode: seu prompt] → [KSampler] → [VAE Decode] → [Save Image]

1. Load Checkpoint — Selecione o modelo FLUX.2 que você baixou
2. CLIP Text Encode — Adicione dois: um para prompt positivo, outro para prompt negativo
3. KSampler — Configure steps (20), cfg (7.5), sampler (euler), scheduler (normal)
4. VAE Decode — Converte o espaço latente em imagem visível
5. Save Image — Salva o resultado como PNG

✅ Checklist da Aula

Entendi o conceito do ComfyUI como hub node-based Conheço os principais pacotes de custom nodes Sei o que são Subgraphs e como usá-los Conheço o ComfyUI Copilot da Alibaba Entendi as estratégias de otimização de VRAM Instalei o ComfyUI localmente (ou na nuvem) Criei meu primeiro workflow text-to-image com FLUX.2

← Aula 7.1 Próxima aula →