🔓 Aula 2.2 ~90 min

FLUX.2 e Stable Diffusion 3.5 — Open-source

Explore o mundo dos modelos de imagem open-source: FLUX.2 da Black Forest Labs e Stable Diffusion 3.5. Aprenda a usar via Hugging Face, APIs e localmente com ComfyUI.

🌊 FLUX.2 — O Gigante Open-source

FLUX.2, desenvolvido pela Black Forest Labs (fundada por ex-criadores do Stable Diffusion), é o modelo de imagem open-source mais avançado disponível em 2026.

FLUX.2 dev — O modelo principal

32 bilhões de parâmetros. Qualidade comparável ao Midjourney V7 em muitos cenários. Suporta resolução até 4 megapixels. Ideal para produção em escala via API ou uso local com GPU potente (16GB+ VRAM recomendado para dev).

FLUX.2 klein — Ultra-rápido

Versão otimizada que gera imagens em sub-1-segundo em GPUs com apenas 8GB VRAM. Perfeita para prototipagem rápida e uso local em hardware modesto. Qualidade ligeiramente inferior ao dev mas velocidade incomparável.

💡 Por que FLUX.2 importa

Com FLUX.2, você tem controle total: sem custos mensais, sem limites de geração, sem termos de uso restritivos, e pode treinar o modelo com seus próprios dados. Para produção comercial em volume, o custo por imagem é praticamente zero (apenas eletricidade/GPU).

🎯 Stable Diffusion 3.5

A Stability AI continua relevante com o SD 3.5, que trouxe a nova arquitetura MMDiT (Multimodal Diffusion Transformer):

Variante	Parâmetros	VRAM mínima	Melhor uso
SD 3.5 Large	8B	12GB	Máxima qualidade, uso profissional
SD 3.5 Medium	2.6B	8GB	Equilíbrio qualidade/velocidade

FLUX.2 vs SD 3.5: qual escolher?

FLUX.2 geralmente produz imagens de maior qualidade e é mais rápido com FLUX klein. SD 3.5 tem a vantagem de um ecossistema mais maduro (mais extensões, LoRAs, e comunidade). Para iniciantes, recomendamos começar com FLUX.2 via Hugging Face e explorar SD 3.5 quando quiser mais controle com ComfyUI.

🚀 Como Usar: Local vs API vs Hugging Face

1. Hugging Face Spaces (mais fácil)

Acesse diretamente no navegador sem instalar nada. Vá para huggingface.co/spaces e busque por "FLUX" ou "Stable Diffusion". Digite seu prompt e gere. Pode ter fila nos horários de pico, mas é 100% gratuito.

2. API (para integração)

Use a API do Hugging Face, Replicate ou Black Forest Labs diretamente. Ideal para automações com n8n ou scripts. Paga por uso (centavos por imagem), mas sem filas e com resposta rápida.

3. Local com ComfyUI (máximo controle)

Instale ComfyUI no seu computador, baixe o modelo e tenha controle total. Requer GPU NVIDIA com 8GB+ VRAM. Sem custos recorrentes, sem limites, sem filas. Curva de aprendizado maior, mas recompensadora.

🔧 ComfyUI para Iniciantes

ComfyUI é uma interface visual baseada em nós (nodes) para rodar modelos de difusão localmente. Parece complexo à primeira vista, mas o conceito é simples:

Fluxo básico de um workflow ComfyUI

1. Loader — Carrega o modelo (FLUX.2 ou SD 3.5)
2. CLIP Text Encode — Converte seu prompt em embeddings
3. KSampler — Gera a imagem (processo de difusão)
4. VAE Decode — Converte o resultado em imagem visível
5. Save Image — Salva o resultado

⚠️ Para este curso

ComfyUI será explorado com mais profundidade nos níveis 2 e 3. Neste nível, o foco é usar Hugging Face Spaces e APIs para gerar imagens com FLUX.2. Se você tem uma GPU potente e quer se antecipar, consulte a documentação oficial do ComfyUI no GitHub.

✅ Checklist da Aula

Entendo as diferenças entre FLUX.2 dev e klein
Conheço as variantes do Stable Diffusion 3.5
Sei as 3 formas de usar modelos open-source (HF, API, local)
Gerei pelo menos 3 imagens via Hugging Face Spaces
Entendo o conceito básico do ComfyUI

← Aula 2.1 Próxima: Aula 2.3 →