๐ต Tabela de precos atualizada
Pricing por 1M tokens. Output sempre custa 3-5x mais que input. Cache reduz input em 90% โ vital para conversas longas.
| Modelo | Input | Output | Cache hit |
|---|---|---|---|
| Opus 4.7 | $15/M | $75/M | $1.50/M |
| GPT-5.5 | $5/M | $30/M | $0.50/M |
| DeepSeek V4 | $0.27/M | $1.20/M | $0.05/M |
๐ก Insight
DeepSeek e ~60x mais barato que Opus em output. Mesmo com 90% cache hit, Opus ainda e mais caro que DeepSeek sem cache.
โก Latencia tipica de cada modelo
Velocidade afeta UX em chat ao vivo e fluxos com humano esperando. Streaming amenizada a sensacao em todos os casos.
DeepSeek V4
TTFT: ~0.5s. Respostas grandes em 5-10s.
GPT-5.5
TTFT: ~1s. Respostas grandes em 10-15s.
Opus 4.7
TTFT: ~1.5s. Respostas grandes em 20-30s.
๐ฏ Qualidade media em benchmarks de codigo
Benchmarks publicos (HumanEval, SWE-bench) mostram gap, mas em fluxo planโexecโreview, DeepSeek + revisao se aproxima do single-Opus em qualidade final.
๐ Benchmarks (HumanEval+ pass@1)
๐ O triangulo de tradeoff
Visualizar ajuda a comunicar a estrategia para times e clientes nao-tecnicos. Cada modelo ocupa uma regiao; combinar te aproxima do centro.
Opus
Qualidade alta + velocidade media. Sacrifica custo.
GPT-5.5
Qualidade alta + custo medio. Sacrifica velocidade max.
DeepSeek
Custo baixo + velocidade alta. Sacrifica qualidade max.
๐งฎ Calculo: custo por feature em projeto medio
Formula simples para estimar antes de cotar projeto.
Formula
Exemplo: feature de 500 linhas, retrabalho 1.5x, peso medio (70/20/10):
- โข 500 ร 8 ร 1.5 = 6000 tokens estimados
- โข 70% ร $1.20 + 20% ร $30 + 10% ร $75 = $14.04/M tokens
- โข 0.006M ร $14.04 = $0.084 por feature
๐ก Otimizacoes ocultas
3 truques que cortam fatura pela metade. Sao "money on the table" โ quem nao usa paga 2x.
๐ฆ Prompt cache
90% off em input repetido. Mande primeiro o contexto grande, depois pergunte.
Economia tipica: 60-80% em conversas longas
๐ฅ Batch API
50% off em saida nao-realtime. Util para geracao de docs em escala.
Economia tipica: 50% em jobs em lote
๐ Streaming
Sem custo extra, melhora UX percebida (usuario ve resposta sendo gerada).
Economia tipica: 0% โ mas UX 3x melhor
๐ Resumo do Modulo
Proximo Modulo:
1.6 โ โ ๏ธ Mitos e armadilhas