MODULO 1.1

๐Ÿค” Por que combinar modelos

A intuicao "um modelo bom resolve tudo" custa caro e entrega menos. Este modulo mostra os mecanismos por tras dessa armadilha โ€” e por que dividir tarefas entre modelos diferentes e o caminho otimo.

6
Topicos
30
Minutos
Basico
Nivel
Teoria
Tipo
1

๐Ÿ’ธ O custo escondido de usar so um modelo

A maioria dos devs comeca com Opus 4.7 ou GPT-5.5 e usa para tudo โ€” desde planejamento ate gerar getter/setter trivial. O problema nao e a qualidade (e otima), e o custo: voce paga premium em tarefas onde um modelo barato entrega o mesmo resultado.

๐Ÿ“Š A matematica do desperdicio

Em projeto de 1M tokens de saida, com Opus 4.7 a $75/M, voce paga $75. Com 70% migrado para DeepSeek V4 a $1.20/M, voce paga: 0.3 ร— $75 + 0.7 ร— $1.20 = $23.34. Mesmo trabalho, 1/3 do custo.

  • โ€ขO premium do modelo caro paga em raciocinio, nao em geracao
  • โ€ขTarefas mecanicas tem qualidade equivalente em modelos baratos
  • โ€ขO custo escala linearmente com tokens, nao com complexidade

๐Ÿ” Sintomas que voce esta no padrao "single-model caro"

  • Fatura mensal acima de $200 em projeto solo
  • "Esperando o modelo gerar" e um problema recorrente no seu fluxo
  • Voce hesita em pedir refatoracao em escala porque sabe que vai gastar caro
  • Tarefas de docstring e testes consomem parcela grande do orcamento
2

โš–๏ธ O triangulo: qualidade x preco x velocidade

Toda decisao de modelo escolhe 2 dos 3 vertices. Combinar modelos e a unica forma de aproximar dos 3 simultaneamente โ€” cada papel pega o vertice certo no momento certo.

QUALIDADE VELOCIDADE CUSTO BAIXO Opus 4.7qual+vel GPT-5.5qual+barato DeepSeekvel+barato 70/20/10

Cada modelo ocupa um lado. Combinar te aproxima do centro โ€” o ponto onde voce tem qualidade alta, custo baixo e velocidade boa.

๐Ÿ’ก Dica pratica

Ao escolher um modelo, pergunte: "Qual vertice eu posso sacrificar nesta tarefa?". Se for "qualidade", DeepSeek. Se for "velocidade", GPT-5.5. Se for "custo", Opus. Nunca pergunte "qual o melhor?" โ€” a pergunta certa e "melhor para o que?".

3

๐Ÿง  Cada modelo tem um perfil โ€” use a forca de cada um

Modelos sao como pessoas: cada um e bom em coisas diferentes. GPT-5.5 brilha em raciocinio multi-step. Opus 4.7 brilha em sensibilidade e criatividade. DeepSeek V4 brilha em volume rapido a baixo custo.

DeepSeek V4

Executor

Rapido, barato, qualidade boa-o-suficiente em 80% das tarefas. Padroes ja conhecidos sao seu ponto forte.

GPT-5.5

Arquiteto

Conecta 5+ pecas com rigor. Identifica riscos antes de codificar. Excelente debug em problemas com estado.

Opus 4.7

Designer

Sensibilidade humana. Decide entre 2 designs, escreve copy que converte, polimento final.

4

๐Ÿ”„ Especializacao reduz erro em tarefas complexas

Pedir ao mesmo modelo "pensa, codifica e revisa" em um prompt unico leva a pulos de etapa. O modelo apressa o pensamento para chegar no codigo, e nao revisa criticamente o que ele mesmo acabou de escrever.

โœ“ Pipeline em etapas

  • โœ“Cada etapa tem checkpoint auditavel
  • โœ“Erro detectado cedo, corrigido barato
  • โœ“Modelo focado em uma tarefa por vez
  • โœ“Revisao por outro modelo evita vies

โœ— Monolito de prompt

  • โœ—Modelo apressa pensamento para gerar
  • โœ—Revisao do proprio output e cega
  • โœ—Bug aparece so na execucao
  • โœ—Custo de retrabalho explode
5

๐Ÿš€ Times de dev tradicionais ja faziam isso

Empresas dividem trabalho por nivel de senioridade desde sempre: senior planeja, junior executa, tech lead revisa. O setup multi-modelo e a versao IA dessa estrutura โ€” e a intuicao que voce ja tem sobre delegacao funciona perfeitamente aqui.

โ†’

Senior dev (GPT-5.5)

"Quebra a feature em tarefas, define interfaces, identifica riscos." โ€” analogo ao "tech lead designa sprint".

โ†’

Junior dev produtivo (DeepSeek V4)

"Implementa exatamente o plano, gera 5 componentes parecidos, escreve docstrings." โ€” analogo ao dev pleno que entrega volume.

โ†’

Code reviewer (GPT-5.5/Opus)

"Le o diff, busca bugs, confirma aderencia ao plano." โ€” analogo ao tech lead que aprova merge.

6

๐Ÿ“Š Casos onde combinar foi 5x mais barato

Numeros reais de 3 projetos comparativos โ€” single-model vs combinacao 70/20/10. Em todos, a combinacao venceu em custo (e na maioria, empatou em qualidade).

ProjetoSingle-OpusSingle-DeepSeek70/20/10Vencedor
SaaS pequeno (1 dia)$9.40$0.85 + 4 bugs$1.8070/20/10
Refatoracao legada$12.00$1.40 + falhas$1.2070/20/10
API + testes$8.50$0.90$2.1070/20/10

๐ŸŽฏ A licao

Single-DeepSeek parece mais barato, mas o custo dos bugs em producao (debug, hotfix, retrabalho) supera a economia. Single-Opus e caro, sem ganho proporcional. 70/20/10 e o sweet spot em 90% dos projetos.

๐Ÿ“Œ Resumo do Modulo

โœ“
Custo escondido: single-model premium paga 3-5x a mais sem ganho proporcional
โœ“
Triangulo de tradeoff: qualidade, velocidade e custo โ€” escolha 2 ou combine modelos
โœ“
Perfis distintos: cada modelo e bom em algo โ€” use a forca de cada
โœ“
Pipeline > monolito: etapas com checkpoint reduzem erro e custo de retrabalho
โœ“
Times tradicionais: a logica de senior/junior/reviewer ja existe โ€” multi-modelo e a versao IA
โœ“
Numeros reais: 70/20/10 venceu em custo nos 3 estudos de caso, sem perder qualidade

Proximo Modulo:

1.2 โ€” ๐ŸŽญ Os 3 perfis: arquiteto, designer, executor