Anthropic · Relatório de Pesquisa

Claude Opus 4.8

O modelo mais capaz da Anthropic até hoje, lançado em 28 de maio de 2026 — o ciclo de atualização mais rápido da família 4.x. Foco em codificação agêntica de longo horizonte, autonomia e janela de 1M de tokens.

Lançamento: 28/05/2026 (quinta-feira) API ID: claude-opus-4-8 Contexto: 1M tokens Verificação: 25/25 claims confirmados · 0 refutados

Resumo executivo

A Anthropic lançou o Claude Opus 4.8 (claude-opus-4-8) em 28 de maio de 2026, cerca de 41–42 dias após o Opus 4.7 — o intervalo mais curto da família 4.x, cujos ciclos anteriores rondavam 70–73 dias. A imprensa (TechCrunch) liga o ritmo acelerado à recepção morna do 4.7, que boa parte da comunidade considerou uma regressão.

É um modelo de raciocínio híbrido com 1M de tokens de contexto (200k no Microsoft Foundry), 128k de saída e pensamento adaptativo, posicionado para codificação agêntica de longo horizonte e tarefas autônomas que duram horas. Nos benchmarks divulgados pela própria Anthropic, supera o 4.7, o GPT-5.5 e o Gemini 3.1 Pro. Preços regulares inalterados em relação ao 4.7; novo fast mode 2,5× mais rápido e ~3× mais barato que o do 4.7. Disponível desde o dia do lançamento em claude.ai, API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry e GitHub Copilot.

Especificações principais

Janela de contexto
1M tokens (200k no Foundry)
Saída máxima
128k tokens
Tipo
Híbrido raciocínio adaptativo
Preço entrada / saída
$5 / $25 por M tokens

Melhorias comportamentais sobre o 4.7 (documentação oficial): codificação agêntica de longo horizonte (melhor manejo de contexto longo, menos compactações e melhor recuperação após compactação), calibração do esforço de raciocínio e tool triggering mais confiável (menos chamadas de ferramenta puladas). 3-0 ✓

Principais novidades e recursos

Benchmarks de desempenho

BenchmarkOpus 4.8Opus 4.7GPT-5.5Gemini 3.1 Pro
SWE-bench Pro69,2%64,3%58,6%54,2%
SWE-bench Verified88,6%87,6%
Uso de computador (OSWorld)83,4%78,7%76,2%
Online-Mind2Web84%
HLE (com ferramentas)57,9%
USAMO (matemática)96,7%
GraphWalks 1M (F1)68,1%
Artificial Analysis Index61,4
Números auto-reportados pela Anthropic, com comparações de concorrentes de primeira-parte. 3-0 ✓  Ver ressalvas sobre auditoria independente.

Preços e acesso (API)

ItemValor (por M tokens)
Entrada (regular)US$ 5,00
Saída (regular)US$ 25,00
Cache write (5 min)US$ 6,25
Cache write (1 h)US$ 10,00
Cache hitUS$ 0,50
Fast mode — entrada / saídaUS$ 10,00 / US$ 50,00
Preços regulares idênticos aos do Opus 4.7 e 4.6. Até 90% de economia com prompt caching e 50% com batch. 3-0 ✓

Disponibilidade no dia 1: claude.ai · Claude API (claude-opus-4-8) · Amazon Bedrock / Claude Platform on AWS · Google Vertex AI · Microsoft Foundry (contexto limitado a 200k) · GitHub Copilot. 3-0 ✓

Comparação com versões anteriores

ModeloLançamentoIntervaloObservação
Opus 4.524/11/2025
Opus 4.605/02/2026~73 dias
Opus 4.716/04/2026~70 diasRecepção morna; ~85% no r/Anthropic chamou de regressão
Opus 4.828/05/2026~42 diasCiclo mais rápido da família 4.x
Fontes citam "41 dias" por arredondamento; o intervalo real entre 16/04 e 28/05 é de 42 dias. 3-0 ✓

A Anthropic descreve o 4.8 como uma "melhoria modesta, porém tangível" sobre o 4.7 — caracterização corroborada de forma independente (Vellum, The Decoder, Simon Willison) pelos ganhos incrementais nos benchmarks.

Recepção da comunidade

O lançamento veio rápido na esteira da recepção morna do Opus 4.7, que parte expressiva da comunidade (cerca de 85% em uma enquete do r/Anthropic) classificou como regressão, inclusive com queda no benchmark MRCR em relação ao 4.6. A cobertura inicial do 4.8 é majoritariamente de imprensa de lançamento — The Decoder o resume como "uma melhoria modesta, mas tangível, que supera o GPT-5.5 na maioria dos benchmarks". Testes independentes em pequena escala (TrueFoundry, 50 problemas; um teste de 20 tarefas em long-context na Towards AI) apontaram na mesma direção dos números oficiais, mas ainda não há auditoria independente em larga escala.

Ressalvas e perguntas em aberto

⚠ Ressalvas metodológicas

  • Quase todos os benchmarks são auto-reportados pela Anthropic, com comparações de concorrentes de primeira-parte — sem auditoria independente em escala (apenas testes pequenos: TrueFoundry, 50 problemas).
  • O posicionamento ("mais capaz", "melhoria modesta porém tangível") é framing de fornecedor/marketing, ainda que corroborado por terceiros.
  • A ligação entre o lançamento acelerado e a recepção do 4.7 é especulativa (atribuída à TechCrunch).
  • Relatório produzido em 30/05/2026, 2 dias após o lançamento — é cobertura de lançamento, não retrospectiva. A tabela de benchmarks da Anthropic é uma imagem; algumas verificações dependeram de resumos de busca.

Perguntas em aberto

Fontes (20 · 6 primárias)

  1. anthropic.com — Anúncio oficial Claude Opus 4.8primária
  2. anthropic.com — Página do produto Opusprimária
  3. platform.claude.com — What's new in Opus 4.8 (docs)primária
  4. platform.claude.com — Pricing (docs)primária
  5. aws.amazon.com — Opus 4.8 na AWS (blog)primária
  6. techcrunch.com — Release do Opus 4.8 com Dynamic Workflowssecundária
  7. vellum.ai — Benchmarks explicadossecundária
  8. the-decoder.com — "modesta mas tangível, supera GPT-5.5"secundária
  9. digitalapplied.com — Release & Dynamic Workflowssecundária
  10. exame.com — O que muda no novo modelosecundária
  11. tokenmix.ai — Review, preços e benchmarksecundária
  12. llm-stats.com — Análise de lançamentosecundária
  13. artificialanalysis.ai — Provedores e índicesecundária
  14. openrouter.ai — Opus 4.8 (Fast)secundária
  15. wavespeed.ai — Opus 4.8secundária
  16. requesty.ai — Opus 4.8 no Vertex (EU)secundária
  17. tomsguide.com — "menos propenso a forjar respostas"secundária
  18. towardsai.net — Teste 4.8 vs GPT-5.5 vs Gemini 3.1 Problog
  19. vellum.ai — Benchmarks do Opus 4.7 (comparação)blog
  20. news.ycombinator.com — Discussão na comunidadefórum