FLUX.2 e Stable Diffusion 3.5 — Open-source
Explore o mundo dos modelos de imagem open-source: FLUX.2 da Black Forest Labs e Stable Diffusion 3.5. Aprenda a usar via Hugging Face, APIs e localmente com ComfyUI.
🌊 FLUX.2 — O Gigante Open-source
FLUX.2, desenvolvido pela Black Forest Labs (fundada por ex-criadores do Stable Diffusion), é o modelo de imagem open-source mais avançado disponível em 2026.
FLUX.2 dev — O modelo principal
32 bilhões de parâmetros. Qualidade comparável ao Midjourney V7 em muitos cenários. Suporta resolução até 4 megapixels. Ideal para produção em escala via API ou uso local com GPU potente (16GB+ VRAM recomendado para dev).
FLUX.2 klein — Ultra-rápido
Versão otimizada que gera imagens em sub-1-segundo em GPUs com apenas 8GB VRAM. Perfeita para prototipagem rápida e uso local em hardware modesto. Qualidade ligeiramente inferior ao dev mas velocidade incomparável.
💡 Por que FLUX.2 importa
Com FLUX.2, você tem controle total: sem custos mensais, sem limites de geração, sem termos de uso restritivos, e pode treinar o modelo com seus próprios dados. Para produção comercial em volume, o custo por imagem é praticamente zero (apenas eletricidade/GPU).
🎯 Stable Diffusion 3.5
A Stability AI continua relevante com o SD 3.5, que trouxe a nova arquitetura MMDiT (Multimodal Diffusion Transformer):
| Variante | Parâmetros | VRAM mínima | Melhor uso |
|---|---|---|---|
| SD 3.5 Large | 8B | 12GB | Máxima qualidade, uso profissional |
| SD 3.5 Medium | 2.6B | 8GB | Equilíbrio qualidade/velocidade |
FLUX.2 vs SD 3.5: qual escolher?
FLUX.2 geralmente produz imagens de maior qualidade e é mais rápido com FLUX klein. SD 3.5 tem a vantagem de um ecossistema mais maduro (mais extensões, LoRAs, e comunidade). Para iniciantes, recomendamos começar com FLUX.2 via Hugging Face e explorar SD 3.5 quando quiser mais controle com ComfyUI.
🚀 Como Usar: Local vs API vs Hugging Face
1. Hugging Face Spaces (mais fácil)
Acesse diretamente no navegador sem instalar nada. Vá para huggingface.co/spaces e busque por "FLUX" ou "Stable Diffusion". Digite seu prompt e gere. Pode ter fila nos horários de pico, mas é 100% gratuito.
2. API (para integração)
Use a API do Hugging Face, Replicate ou Black Forest Labs diretamente. Ideal para automações com n8n ou scripts. Paga por uso (centavos por imagem), mas sem filas e com resposta rápida.
3. Local com ComfyUI (máximo controle)
Instale ComfyUI no seu computador, baixe o modelo e tenha controle total. Requer GPU NVIDIA com 8GB+ VRAM. Sem custos recorrentes, sem limites, sem filas. Curva de aprendizado maior, mas recompensadora.
🔧 ComfyUI para Iniciantes
ComfyUI é uma interface visual baseada em nós (nodes) para rodar modelos de difusão localmente. Parece complexo à primeira vista, mas o conceito é simples:
Fluxo básico de um workflow ComfyUI
- 1. Loader — Carrega o modelo (FLUX.2 ou SD 3.5)
- 2. CLIP Text Encode — Converte seu prompt em embeddings
- 3. KSampler — Gera a imagem (processo de difusão)
- 4. VAE Decode — Converte o resultado em imagem visível
- 5. Save Image — Salva o resultado
⚠️ Para este curso
ComfyUI será explorado com mais profundidade nos níveis 2 e 3. Neste nível, o foco é usar Hugging Face Spaces e APIs para gerar imagens com FLUX.2. Se você tem uma GPU potente e quer se antecipar, consulte a documentação oficial do ComfyUI no GitHub.
✅ Checklist da Aula
- Entendo as diferenças entre FLUX.2 dev e klein
- Conheço as variantes do Stable Diffusion 3.5
- Sei as 3 formas de usar modelos open-source (HF, API, local)
- Gerei pelo menos 3 imagens via Hugging Face Spaces
- Entendo o conceito básico do ComfyUI