Anthropic · Relatório de Pesquisa

Claude Opus 4.8

O modelo mais capaz da Anthropic até hoje, lançado em 28 de maio de 2026 — o ciclo de atualização mais rápido da família 4.x. Foco em codificação agêntica de longo horizonte, autonomia e janela de 1M de tokens.

Lançamento: 28/05/2026 (quinta-feira) API ID: claude-opus-4-8 Contexto: 1M tokens Verificação: 25/25 claims confirmados · 0 refutados

Resumo Especificações Novidades Benchmarks Preços Comparação Recepção Ressalvas Fontes

Resumo executivo

A Anthropic lançou o Claude Opus 4.8 (claude-opus-4-8) em 28 de maio de 2026, cerca de 41–42 dias após o Opus 4.7 — o intervalo mais curto da família 4.x, cujos ciclos anteriores rondavam 70–73 dias. A imprensa (TechCrunch) liga o ritmo acelerado à recepção morna do 4.7, que boa parte da comunidade considerou uma regressão.

É um modelo de raciocínio híbrido com 1M de tokens de contexto (200k no Microsoft Foundry), 128k de saída e pensamento adaptativo, posicionado para codificação agêntica de longo horizonte e tarefas autônomas que duram horas. Nos benchmarks divulgados pela própria Anthropic, supera o 4.7, o GPT-5.5 e o Gemini 3.1 Pro. Preços regulares inalterados em relação ao 4.7; novo fast mode 2,5× mais rápido e ~3× mais barato que o do 4.7. Disponível desde o dia do lançamento em claude.ai, API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry e GitHub Copilot.

Especificações principais

Janela de contexto

1M tokens (200k no Foundry)

Saída máxima

128k tokens

Tipo

Híbrido raciocínio adaptativo

Preço entrada / saída

$5 / $25 por M tokens

Melhorias comportamentais sobre o 4.7 (documentação oficial): codificação agêntica de longo horizonte (melhor manejo de contexto longo, menos compactações e melhor recuperação após compactação), calibração do esforço de raciocínio e tool triggering mais confiável (menos chamadas de ferramenta puladas). 3-0 ✓

Principais novidades e recursos

Controle de esforço no claude.ai — dial de quanto esforço o modelo aplica à tarefa (níveis Low / Medium / High / Extra / Max; padrão high).
Dynamic Workflows (research preview, no Claude Code) — o modelo planeja o trabalho e dispara centenas de subagentes paralelos numa única sessão, com verificação de saídas; com o 4.8 os agentes rodam por mais tempo.
Fast mode — produz tokens a ~2,5× a velocidade normal, e ~3× mais barato que o fast mode do 4.7.
API Messages — aceita system inline, sem necessidade de header beta.
~4× menos propenso (segundo a Anthropic) a deixar passar falhas no próprio código que o antecessor.

Benchmarks de desempenho

Números auto-reportados pela Anthropic, com comparações de concorrentes de primeira-parte. 3-0 ✓ Ver ressalvas sobre auditoria independente.
Benchmark	Opus 4.8	Opus 4.7	GPT-5.5	Gemini 3.1 Pro
SWE-bench Pro	69,2%	64,3%	58,6%	54,2%
SWE-bench Verified	88,6%	87,6%	—	—
Uso de computador (OSWorld)	83,4%	—	78,7%	76,2%
Online-Mind2Web	84%	—	—	—
HLE (com ferramentas)	57,9%	—	—	—
USAMO (matemática)	96,7%	—	—	—
GraphWalks 1M (F1)	68,1%	—	—	—
Artificial Analysis Index	61,4	—	—	—

Preços e acesso (API)

Preços regulares idênticos aos do Opus 4.7 e 4.6. Até 90% de economia com prompt caching e 50% com batch. 3-0 ✓
Item	Valor (por M tokens)
Entrada (regular)	US$ 5,00
Saída (regular)	US$ 25,00
Cache write (5 min)	US$ 6,25
Cache write (1 h)	US$ 10,00
Cache hit	US$ 0,50
Fast mode — entrada / saída	US$ 10,00 / US$ 50,00

Disponibilidade no dia 1: claude.ai · Claude API (claude-opus-4-8) · Amazon Bedrock / Claude Platform on AWS · Google Vertex AI · Microsoft Foundry (contexto limitado a 200k) · GitHub Copilot. 3-0 ✓

Comparação com versões anteriores

Fontes citam "41 dias" por arredondamento; o intervalo real entre 16/04 e 28/05 é de 42 dias. 3-0 ✓
Modelo	Lançamento	Intervalo	Observação
Opus 4.5	24/11/2025	—	—
Opus 4.6	05/02/2026	~73 dias	—
Opus 4.7	16/04/2026	~70 dias	Recepção morna; ~85% no r/Anthropic chamou de regressão
Opus 4.8	28/05/2026	~42 dias	Ciclo mais rápido da família 4.x

A Anthropic descreve o 4.8 como uma "melhoria modesta, porém tangível" sobre o 4.7 — caracterização corroborada de forma independente (Vellum, The Decoder, Simon Willison) pelos ganhos incrementais nos benchmarks.

Recepção da comunidade

O lançamento veio rápido na esteira da recepção morna do Opus 4.7, que parte expressiva da comunidade (cerca de 85% em uma enquete do r/Anthropic) classificou como regressão, inclusive com queda no benchmark MRCR em relação ao 4.6. A cobertura inicial do 4.8 é majoritariamente de imprensa de lançamento — The Decoder o resume como "uma melhoria modesta, mas tangível, que supera o GPT-5.5 na maioria dos benchmarks". Testes independentes em pequena escala (TrueFoundry, 50 problemas; um teste de 20 tarefas em long-context na Towards AI) apontaram na mesma direção dos números oficiais, mas ainda não há auditoria independente em larga escala.

Ressalvas e perguntas em aberto

⚠ Ressalvas metodológicas

Quase todos os benchmarks são auto-reportados pela Anthropic, com comparações de concorrentes de primeira-parte — sem auditoria independente em escala (apenas testes pequenos: TrueFoundry, 50 problemas).
O posicionamento ("mais capaz", "melhoria modesta porém tangível") é framing de fornecedor/marketing, ainda que corroborado por terceiros.
A ligação entre o lançamento acelerado e a recepção do 4.7 é especulativa (atribuída à TechCrunch).
Relatório produzido em 30/05/2026, 2 dias após o lançamento — é cobertura de lançamento, não retrospectiva. A tabela de benchmarks da Anthropic é uma imagem; algumas verificações dependeram de resumos de busca.

Perguntas em aberto

Como o 4.8 se sustenta em benchmarks independentes head-to-head contra GPT-5.5 e Gemini 3.1 Pro?
Qual a recepção real da comunidade nas semanas seguintes — resolve as queixas do 4.7?
Quais os limites e a data de GA das features em research preview (Dynamic Workflows, fast mode)?
O fast mode 3× mais barato vale em todas as plataformas, e qual o impacto do limite de 200k no Foundry?

Fontes (20 · 6 primárias)

anthropic.com — Anúncio oficial Claude Opus 4.8primária
anthropic.com — Página do produto Opusprimária
platform.claude.com — What's new in Opus 4.8 (docs)primária
platform.claude.com — Pricing (docs)primária
aws.amazon.com — Opus 4.8 na AWS (blog)primária
techcrunch.com — Release do Opus 4.8 com Dynamic Workflowssecundária
vellum.ai — Benchmarks explicadossecundária
the-decoder.com — "modesta mas tangível, supera GPT-5.5"secundária
digitalapplied.com — Release & Dynamic Workflowssecundária
exame.com — O que muda no novo modelosecundária
tokenmix.ai — Review, preços e benchmarksecundária
llm-stats.com — Análise de lançamentosecundária
artificialanalysis.ai — Provedores e índicesecundária
openrouter.ai — Opus 4.8 (Fast)secundária
wavespeed.ai — Opus 4.8secundária
requesty.ai — Opus 4.8 no Vertex (EU)secundária
tomsguide.com — "menos propenso a forjar respostas"secundária
towardsai.net — Teste 4.8 vs GPT-5.5 vs Gemini 3.1 Problog
vellum.ai — Benchmarks do Opus 4.7 (comparação)blog
news.ycombinator.com — Discussão na comunidadefórum