Pular para conteúdo
Nível 2 ~120 min

ComfyUI — Hub do Ecossistema Open-Source

Domine o ComfyUI, a interface node-based que se tornou o hub central para rodar modelos open-source de imagem e vídeo com controle total sobre cada etapa do pipeline.

1

🔧 O que é o ComfyUI?

O ComfyUI é uma interface gráfica node-based e open-source para rodar modelos de IA generativa. Enquanto ferramentas como Midjourney ou Runway oferecem uma experiência simplificada (digita prompt → recebe resultado), o ComfyUI expõe cada etapa do pipeline de geração como um nó visual que você pode configurar, conectar e customizar.

Pense nele como o "Blender da IA generativa" — poderoso, flexível, com curva de aprendizado, mas com possibilidades praticamente ilimitadas.

Por que o ComfyUI dominou?

Três razões: (1) é 100% gratuito e open-source, (2) suporta virtualmente qualquer modelo open-source via custom nodes, e (3) a comunidade criou mais de 1000 pacotes de custom nodes que estendem suas capacidades infinitamente.

2

📦 1000+ Custom Nodes

O ecossistema de custom nodes é o que torna o ComfyUI verdadeiramente poderoso. Cada pacote de nós adiciona novas funcionalidades:

Pacote de Nós Funcionalidade
ComfyUI-Wan Integração com Wan 2.5/2.7 para geração de vídeo
ComfyUI-FLUX Suporte ao FLUX.2 para imagens fotorrealísticas
ComfyUI-SkyReels Pipeline SkyReels V4 para vídeo com áudio
Rodin3D Nodes Geração de modelos 3D a partir de imagens
ControlNet Nodes Controle de pose, profundidade, bordas e composição
LatentCut Node Corte e composição no espaço latente (sem artefatos)
IP-Adapter Nodes Transferência de estilo e consistência de personagem
3

🧩 Subgraphs — Workflows Modulares

Os Subgraphs são uma funcionalidade avançada que permite encapsular workflows complexos em um único nó reutilizável. Isso possibilita:

  • Modularidade — Crie "blocos" que podem ser reutilizados em diferentes projetos
  • Organização — Mantenha workflows complexos legíveis e gerenciáveis
  • Compartilhamento — Exporte subgraphs para a comunidade ou equipe
  • Abstração — Esconda a complexidade e exponha apenas os parâmetros relevantes
4

🤖 ComfyUI Copilot (Alibaba)

O ComfyUI Copilot, desenvolvido pela Alibaba, é um assistente de IA integrado ao ComfyUI que acelera drasticamente a curva de aprendizado:

  • Geração de workflows por prompt — Descreva o que quer e o Copilot monta o workflow
  • Explicação de nós — Passe o mouse sobre qualquer nó e receba uma explicação detalhada
  • Debug assistido — O Copilot identifica e sugere correções para erros no workflow
  • 10x mais rápido — Segundo a Alibaba, o Copilot acelera o aprendizado do ComfyUI em 10 vezes

Como ativar o Copilot

Instale a extensão ComfyUI-Copilot via ComfyUI Manager. Após reiniciar, um ícone de chat aparece na interface. Você pode pedir: "Crie um workflow para gerar imagem com FLUX.2, aplicar ControlNet de pose, e fazer upscale 4x".

5

💾 Otimização de VRAM

Rodar modelos grandes localmente exige gerenciamento cuidadoso de VRAM. O ComfyUI oferece várias estratégias:

Estratégia Comando/Configuração Economia de VRAM
FP16 Intermediates --fp16-intermediates ~30-40%
Low VRAM Mode --lowvram ~50%
CPU Offload --cpu Máxima (mais lento)
Tiled VAE Nó VAE Decode (Tiled) ~20% no decode

Recomendação de hardware

Para geração de imagens com FLUX.2: mínimo 12GB VRAM (RTX 3060/4060). Para vídeo com Wan 2.7: mínimo 24GB VRAM (RTX 4090 ou A100). Com --fp16-intermediates, uma RTX 3090 (24GB) roda a maioria dos modelos confortavelmente.

6

🛠️ Configurando o ComfyUI localmente

Passo 1 — Instalar pré-requisitos

Python 3.10+, Git, CUDA toolkit (NVIDIA) ou ROCm (AMD). Verifique com nvidia-smi se sua GPU é reconhecida.

Passo 2 — Clonar o repositório

git clone https://github.com/comfyanonymous/ComfyUI.git

Passo 3 — Instalar dependências

pip install -r requirements.txt

Passo 4 — Baixar modelo FLUX.2

Baixe o modelo FLUX.2-schnell do Hugging Face e coloque em ComfyUI/models/checkpoints/

Passo 5 — Iniciar o ComfyUI

python main.py --fp16-intermediates

Acesse http://127.0.0.1:8188 no navegador.

7

🎨 Primeiro workflow: Text-to-Image com FLUX.2

Crie seu primeiro workflow conectando estes nós na ordem:

[Load Checkpoint: FLUX.2] → [CLIP Text Encode: seu prompt] → [KSampler] → [VAE Decode] → [Save Image]

  • 1. Load Checkpoint — Selecione o modelo FLUX.2 que você baixou
  • 2. CLIP Text Encode — Adicione dois: um para prompt positivo, outro para prompt negativo
  • 3. KSampler — Configure steps (20), cfg (7.5), sampler (euler), scheduler (normal)
  • 4. VAE Decode — Converte o espaço latente em imagem visível
  • 5. Save Image — Salva o resultado como PNG
8

Checklist da Aula