MÓDULO 2.6 · EXERCÍCIOS

✏️ Exercícios da Trilha 2

Fixe datas, benchmarks e preços com questões de gabarito comentado e desafios práticos. Tente responder antes de revelar a resposta.

6
Questões
2
Práticos
~25
Minutos
Gabarito
Comentado

Parte 1 — Quiz com gabarito

1

Em que data o Claude Opus 4.7 foi lançado?

Resposta: b) 16/04/2026

O 4.7 saiu em 16 de abril de 2026. O 4.8 veio ~42 dias depois, em 28/05/2026. As outras datas são fictícias.

2

Qual é o score do Opus 4.8 no SWE-bench Pro?

Resposta: c) 69,2%

64,3% é o 4.7; 88,6% é o SWE-bench Verified (diferente do Pro); 58,6% é o GPT-5.5. O 4.8 no SWE-bench Pro = 69,2% (auto-reportado).

3

Quanto custa um cache hit no Opus 4.8 (por milhão de tokens)?

Resposta: b) US$0,50

Cache hit = US$0,50/M — 10× mais barato que a entrada regular (US$5/M). US$6,25 é o cache write com TTL 5 min.

4

Verdadeiro ou falso: "O fast mode do Opus 4.8 é mais caro que o fast mode do 4.7 para a mesma qualidade entregue."

Resposta: Falso

O fast mode do 4.8 é ~3× mais barato que o fast mode do 4.7 para qualidade equivalente — justamente porque o 4.8 é mais capaz no modo regular, o que eleva o patamar de desempenho do fast.

5

Qual é o benchmark que mede recuperação de informação em grafos de conhecimento distribuídos em 1M de tokens?

Resposta: c) GraphWalks

GraphWalks mede precisão de recuperação (F1) em grafos de entidades distribuídas em contextos de 1M de tokens. O 4.8 atinge 68,1% F1. Online-Mind2Web é navegação web autônoma.

6

O desconto de 50% da API Batch se aplica sobre qual preço base?

Resposta: c) Preço regular

Batch desconta 50% sobre o preço regular: US$5/M → US$2,50/M entrada; US$25/M → US$12,50/M saída. Pode ser combinado com cache para economia acumulada.

Parte 2 — Desafios práticos

🧮 Desafio 1 — Regular vs fast mode

Você tem um chat interativo com 500 usuários/dia. Cada conversa usa ~5k tokens de entrada e ~1k de saída. Calcule o custo diário no modo regular e no fast mode. Quando o fast mode se justifica?

Regular: Entrada: 500 × 5k = 2,5M × US$5/M = US$12,50. Saída: 500 × 1k = 0,5M × US$25/M = US$12,50. Total = US$25/dia.

Fast mode: Entrada: 2,5M × US$10/M = US$25. Saída: 0,5M × US$50/M = US$25. Total = US$50/dia.

Diferença: US$25/dia extra (~US$750/mês) pelo fast mode. Se a latência menor reduz abandono ou melhora conversão, pode valer. Se o chat tolera 2-3s de resposta, o regular é suficiente.

🔬 Desafio 2 — Comparar 4.7 vs 4.8 numa tarefa de código

Escolha uma tarefa de código com complexidade real (bug fix, refatoração, feature pequena). Execute no claude-opus-4-7 e no claude-opus-4-8 com o mesmo prompt.

Critério de avaliação: compare (1) qualidade do código gerado, (2) cobertura de edge cases e (3) clareza da explicação. Documente se houve diferença perceptível — esse é o tipo de avaliação que benchmarks não capturam.

🏁 Autoavaliação

Ao fim da Trilha 2, você deveria conseguir explicar:

Datas de lançamento do 4.7 (16/04) e 4.8 (28/05/2026)
O que HLE, USAMO, GraphWalks e AA Index medem
Diferença entre SWE-bench Pro (69,2%) e Verified (88,6%)
Estrutura de preços: regular, cache (write/hit), batch, fast
Como calcular custo de um workload real
Por que benchmarks são auto-reportados e o que isso implica