Trilha 3 · Na prática

3.1~25 min

⚡ Fast mode

O modo de alta velocidade do Opus 4.8: preço, ganho de velocidade e quando usar.

O que é:

Fast mode é uma variante de inferência do Opus 4.8 que entrega respostas com latência significativamente reduzida, sacrificando parte do raciocínio profundo em troca de velocidade.

Por que aprender:

Para tarefas de alto volume ou time-sensitive, fast mode elimina gargalos de latência sem trocar de modelo.

Conceitos-chave:

Mesma família Opus 4.8; endpoint distinto; trade-off velocidade × profundidade de raciocínio.

O que é:

A Anthropic afirma que o fast mode entrega respostas ~2,5x mais rápidas do que o modo regular do Opus 4.8.

Por que aprender:

2,5x de ganho é relevante em pipelines de agentes onde múltiplas chamadas se somam — a latência total pode cair pela metade ou mais.

Conceitos-chave:

~2,5x mais rápido (auto-reportado pela Anthropic); comparação contra o próprio Opus 4.8 regular.

O que é:

Fast mode custa US$10 por milhão de tokens de entrada e US$50 por milhão de tokens de saída.

Por que aprender:

Saber o preço permite orçar pipelines e comparar com o custo do modo regular antes de migrar.

Conceitos-chave:

US$10/M entrada · US$50/M saída; verifique os preços atuais na página da API da Anthropic.

O que é:

Comparado ao fast mode do Opus 4.7, o fast mode do 4.8 é ~3x mais barato — uma redução de custo significativa entre gerações.

Por que aprender:

Quem já usava o fast mode do 4.7 tem um incentivo econômico claro para migrar, além do ganho de qualidade.

Conceitos-chave:

~3x mais barato que o fast mode do 4.7 (auto-reportado); comparação entre modelos de gerações diferentes.

O que é:

Use fast para tarefas de alto volume, respostas rápidas e chamadas em pipelines de agente onde latência acumula. Use regular para raciocínio profundo, problemas difíceis e tarefas críticas.

Por que aprender:

A decisão errada custa caro: fast demais para tarefas difíceis → qualidade ruim; regular para tudo → latência e custo excessivos.

Conceitos-chave:

Fast = volume/velocidade; regular = qualidade/complexidade; meça antes de fixar a escolha.

O que é:

Fast mode está disponível via Claude API, Amazon Bedrock e Google Vertex AI. Verifique disponibilidade no claude.ai e outras plataformas na documentação oficial.

Por que aprender:

Nem toda plataforma suporta todos os modos — confirmar disponibilidade antes de planejar a arquitetura evita surpresas.

Conceitos-chave:

Disponibilidade varia por plataforma; consulte docs.anthropic.com para o status atualizado.

Ver Completo

3.2~30 min

🔀 Dynamic Workflows

O novo recurso de orquestração paralela em research preview no Claude Code.

O que é:

Dynamic Workflows é um recurso lançado em research preview no Claude Code: permite que o Opus 4.8 orquestre tarefas complexas usando centenas de subagentes paralelos numa mesma sessão.

Por que aprender:

É o recurso de maior impacto para equipes de engenharia que usam o Claude Code para tarefas de desenvolvimento de larga escala.

Conceitos-chave:

Research preview = pode mudar; disponível no Claude Code; orquestração paralela nativa.

O que é:

O modelo pode lançar centenas de subagentes que trabalham em paralelo dentro de uma única sessão, acelerando radicalmente tarefas decomponíveis.

Por que aprender:

Paralelismo real elimina gargalos sequenciais: o que levaria horas com um agente pode ser concluído em minutos com centenas.

Conceitos-chave:

Centenas de subagentes; paralelismo; uma sessão coordenada pelo modelo principal.

O que é:

O ciclo do Dynamic Workflows é: o modelo principal planeja o trabalho, lança subagentes para execução paralela e depois verifica os resultados antes de prosseguir.

Por que aprender:

Entender o ciclo ajuda a estruturar tarefas que se beneficiem do padrão planejar→executar→verificar.

Conceitos-chave:

Plan → execute → verify; o orquestrador mantém coerência entre subagentes.

O que é:

Com o Opus 4.8, os agentes no Dynamic Workflows conseguem rodar por mais tempo do que nas versões anteriores, graças ao melhor manejo de contexto longo e à menor variância.

Por que aprender:

Sessões mais longas significam tarefas mais complexas concluídas sem interrupção — o horizonte autônomo real do modelo aumenta.

Conceitos-chave:

Mais tempo de sessão; fewer compactions; melhor recuperação de contexto.

O que é:

Refatorações massivas de codebase, análise paralela de múltiplos repositórios, geração e teste de código em larga escala, pesquisa e síntese de múltiplas fontes simultaneamente.

Por que aprender:

Identificar os casos certos evita usar Dynamic Workflows onde um único agente seria suficiente — o overhead de orquestração não vale para tarefas simples.

Conceitos-chave:

Tarefas decomponíveis; alto volume; ganho real do paralelismo > overhead de coordenação.

O que é:

Como research preview, o Dynamic Workflows pode ter comportamento instável, limitações não documentadas e mudanças de API sem aviso prévio.

Por que aprender:

Usar um recurso em preview em produção crítica sem essa ciência é um risco operacional real.

Conceitos-chave:

Preview ≠ GA; teste em ambiente controlado; acompanhe o changelog da Anthropic.

Ver Completo

3.3~25 min

🌐 Onde rodar o Opus 4.8

As 6 plataformas disponíveis no dia 1: diferenças e limitações por canal.

O que é:

O claude.ai é a interface web e app da Anthropic, onde qualquer assinante pode usar o Opus 4.8 com controle de esforço (Low/Medium/High/Extra/Max).

Por que aprender:

É o canal mais acessível para explorar o modelo sem código, e o único com o dial de esforço visual.

Conceitos-chave:

Contexto até 1M; dial de esforço; acesso via assinatura Claude Pro/Max.

O que é:

A API Messages da Anthropic com o model ID claude-opus-4-8. Suporta system inline (sem header beta), contexto de 1M e todos os recursos de programação.

Por que aprender:

Canal principal para integrações custom, pipelines de agentes e produção em escala.

Conceitos-chave:

Model ID: claude-opus-4-8; system inline; 1M contexto; 128k saída.

O que é:

Amazon Bedrock oferece o Opus 4.8 com infraestrutura AWS, faturamento integrado e conformidade com políticas corporativas da Amazon.

Por que aprender:

Equipes já na AWS podem integrar o Opus 4.8 sem sair do ecossistema, aproveitando IAM, VPC e logging nativos.

Conceitos-chave:

Bedrock Runtime API; mesmo conjunto de recursos da API direta; faturamento via AWS.

O que é:

Google Vertex AI disponibiliza o Opus 4.8 com integração ao ecossistema GCP, incluindo BigQuery, Cloud Storage e IAM do Google.

Por que aprender:

Equipes GCP-first podem usar o Opus 4.8 sem expor dados a canais externos ao Google Cloud.

Conceitos-chave:

Vertex AI Model Garden; endpoint compatível com API Anthropic; faturamento GCP.

O que é:

Microsoft Foundry oferece o Opus 4.8 integrado ao ecossistema Azure, com a limitação importante de contexto máximo de 200k tokens (não 1M).

Por que aprender:

A limitação de 200k pode quebrar casos de uso que dependem de contexto longo — é crítico saber antes de planejar arquiteturas.

Conceitos-chave:

Contexto máximo: 200k (vs 1M nos outros canais); integração Azure; faturamento Microsoft.

O que é:

O Opus 4.8 está disponível como modelo selecionável no GitHub Copilot, permitindo uso direto no VS Code, JetBrains e outros IDEs sem sair do fluxo de desenvolvimento.

Por que aprender:

Desenvolvedores com assinatura GitHub Copilot Enterprise podem usar o Opus 4.8 sem configuração adicional de API.

Conceitos-chave:

Seleção de modelo no Copilot Chat; integração IDE; requer assinatura Copilot.

Ver Completo

3.4~25 min

🛡️ Confiabilidade & segurança

O que a Anthropic afirma sobre redução de falhas, variância e comportamento previsível.

O que é:

A Anthropic afirma que o Opus 4.8 é ~4x menos provável que o antecessor de deixar passar falhas no próprio código — ou seja, tem maior capacidade de autorrevisão.

Por que aprender:

Menos falhas não detectadas reduz a necessidade de revisão humana em pipelines de geração de código, acelerando CI/CD autônomo.

Conceitos-chave:

~4x (auto-reportado); comparação vs Opus 4.7; autorrevisão de código gerado pelo próprio modelo.

O que é:

A Anthropic descreve o 4.8 como "menos propenso a forjar respostas" — referindo-se a alucinações factuais e fabricação de citações ou dados.

Por que aprender:

Respostas forjadas são o principal risco em aplicações de RAG, pesquisa automatizada e geração de documentos técnicos.

Conceitos-chave:

"Less likely to forge responses" (Anthropic); afirmação qualitativa, não auditada externamente.

O que é:

O 4.8 apresenta menor variância entre execuções da mesma tarefa — saídas mais consistentes para o mesmo prompt, facilitando testes e debugging.

Por que aprender:

Alta variância dificulta testes automatizados e makes CI não-determinístico. Menor variância = pipelines mais confiáveis.

Conceitos-chave:

"Lower output variance" (Anthropic); importante para evals e testes de regressão.

O que é:

A combinação de menor variância, melhor autorrevisão e menos respostas forjadas resulta em menos ciclos de correção necessários para chegar ao output final aceitável.

Por que aprender:

Menos revisões = menor custo total de operação e maior throughput em pipelines de produção.

Conceitos-chave:

"Fewer review cycles" (Anthropic); impacto na velocidade de entrega de produtos com IA.

O que é:

Na prática, menor variância e menos falhas se traduzem em evals mais estáveis, menor taxa de fallback para revisão humana e custos operacionais menores por tarefa concluída.

Por que aprender:

Conecta as melhorias técnicas ao impacto de negócio — o argumento para justificar o custo do Opus 4.8 em produção.

Conceitos-chave:

Evals mais estáveis; menos human-in-the-loop; ROI de confiabilidade.

O que é:

Todas as afirmações de confiabilidade (~4x menos falhas, menor variância) são auto-reportadas pela Anthropic e não foram auditadas por terceiros independentes em escala de produção.

Por que aprender:

Tomar decisões de arquitetura baseadas apenas em benchmarks do próprio fabricante é um risco — valide com seus próprios evals antes de depender dessas métricas.

Conceitos-chave:

Auto-reportado ≠ auditado; execute seus próprios benchmarks; recepção da comunidade: "melhoria modesta porém tangível".

Ver Completo

3.5~25 min

🔄 Migrando para o Opus 4.8

O que muda na chamada, o que revalidar e como a comunidade recebeu o modelo.

O que é:

O único passo obrigatório para migrar é trocar o model ID de claude-opus-4-7 para claude-opus-4-8 nas chamadas de API.

Por que aprender:

A migração é intencionalmente simples — a API mantém compatibilidade entre versões da mesma família.

Conceitos-chave:

Model ID: claude-opus-4-8; compatível com o mesmo payload da 4.7; troque uma string.

O que é:

A API Messages do Opus 4.8 aceita o campo system diretamente no body da requisição, sem necessidade de header beta especial — simplificação em relação a versões anteriores.

Por que aprender:

Quem usava headers beta para o system prompt pode simplificar o código na migração.

Conceitos-chave:

System inline = {"system": "..."} no body; sem anthropic-beta header para isso.

O que é:

Mesmo com compatibilidade de API, mudanças no modelo podem alterar outputs — revalide prompts de produção, evals automatizados e qualquer lógica que dependa de formato específico de saída.

Por que aprender:

Assumir paridade total sem revalidar é o erro mais comum em migrações — pode quebrar parsers e pipelines silenciosamente.

Conceitos-chave:

Revalidar: prompts críticos, evals, parsers de saída, casos de borda conhecidos.

O que é:

O Opus 4.7 teve recepção morna na comunidade (r/Anthropic: ~85% reportaram regressão em algum aspecto). O 4.8 é descrito como "melhoria modesta porém tangível" — positivo, mas sem entusiasmo excessivo.

Por que aprender:

Calibrar expectativas reais antes de migrar evita decepções — o 4.8 é melhor que o 4.7, mas não é um salto de geração dramático.

Conceitos-chave:

4.7 ≈ regressão para muitos; 4.8 = melhoria modesta mas real; expectativa calibrada é melhor que hype.

O que é:

Fast mode e Dynamic Workflows estavam em preview/lançamento recente ao escrever este material; recursos em preview podem mudar sem aviso; benchmarks são auto-reportados.

Por que aprender:

Decisões de produção baseadas em features em preview sem plano de contingência aumentam o risco operacional.

Conceitos-chave:

Preview ≠ estável; auto-reportado ≠ auditado; sempre consulte docs.anthropic.com para o estado atual.

O que é:

1) Trocar model ID; 2) Remover headers beta desnecessários; 3) Executar suite de evals; 4) Comparar outputs críticos; 5) Monitorar métricas de produção por 48h; 6) Rollback plan se necessário.

Por que aprender:

Um checklist estruturado evita os erros mais comuns de migração e garante que nada crítico seja esquecido.

Conceitos-chave:

6 passos; rollback plan; monitoramento pós-migração.

Ver Completo

3.6~30 min

✏️ Exercícios da Trilha 3

Quizzes, desafios práticos e autoavaliação para fixar os recursos do Opus 4.8.

O que é:

Múltipla escolha sobre preço (US$10/M entrada, US$50/M saída), velocidade (~2,5x), comparação com 4.7 e plataformas disponíveis.

Por que aprender:

Verifica retenção dos fatos concretos do fast mode antes de aplicar em decisões reais.

Conceitos-chave:

Gabarito comentado; foco em números verificados.

O que é:

Verdadeiro/falso sobre o ciclo plan→execute→verify, o que é research preview, e quando o paralelismo vale o overhead.

Por que aprender:

Separa o que é fato verificado do que é expectativa não confirmada sobre Dynamic Workflows.

Conceitos-chave:

Preview = experimental; justificativa para cada V/F.

O que é:

Identifique qual plataforma tem contexto de 200k (Foundry), qual é a única com dial visual de esforço (claude.ai) e quais têm 1M de contexto.

Por que aprender:

Errar a plataforma numa arquitetura pode quebrar o sistema inteiro — este quiz fixa as diferenças críticas.

Conceitos-chave:

Foundry = 200k; outros = 1M; dial de esforço = claude.ai apenas.

O que é:

Para 5 cenários dados (análise de contrato legal, resposta de chatbot, refatoração de codebase, classificação de e-mails, auditoria de segurança), escolha fast ou regular e justifique.

Por que aprender:

Aplica a heurística fast = volume/velocidade, regular = complexidade/crítico em situações reais.

Conceitos-chave:

Gabarito com raciocínio por caso; sem resposta única certa para todos.

O que é:

Dado um snippet de chamada API para o Opus 4.7, faça a migração para o 4.8: trocar model ID, adaptar system para inline e remover headers beta desnecessários.

Por que aprender:

Migrar na prática consolida o checklist de migração e expõe diferenças que só ficam claras no código real.

Conceitos-chave:

Snippet antes/depois; critério de sucesso: chamada bem-sucedida ao 4.8.

O que é:

Checklist do que você deveria saber ao fim da Trilha 3: preço do fast mode, ciclo do Dynamic Workflows, diferença de contexto por plataforma, checklist de migração e ressalvas de vendor.

Por que aprender:

Identifica lacunas antes de aplicar o conhecimento em produção.

Conceitos-chave:

Autodiagnóstico; revisitar módulos fracos antes de concluir o curso.

Ver Completo

3.7~20 min

📋 Prompts prontos da Trilha 3

Prompts copiáveis para fast mode, Dynamic Workflows, escolha de plataforma e migração.

O que é:

Prompt que reformula uma tarefa para maximizar o benefício do fast mode: saída estruturada, instrução direta, sem raciocínio explícito desnecessário.

Por que aprender:

Fast mode responde melhor a prompts diretos — reformular para fast é uma habilidade distinta de prompting regular.

Conceitos-chave:

Direto ao ponto; sem chain-of-thought forçado; saída com formato definido.

O que é:

Prompt de orquestração: define a tarefa principal, instrui o modelo a decompor em subtarefas paralelas, especifica critérios de verificação e formato de consolidação dos resultados.

Por que aprender:

Estruturar bem a orquestração é o que separa um Dynamic Workflow eficiente de um caótico — o prompt do orquestrador é o ponto crítico.

Conceitos-chave:

Tarefa + decomposição + critério de verificação + formato de consolidação.

O que é:

Prompt que pede ao Opus 4.8 para recomendar a plataforma ideal dado um conjunto de restrições: nuvem atual, requisito de contexto, conformidade, budget e features necessárias.

Por que aprender:

Usar o próprio modelo para ajudar na decisão de plataforma é um caso de uso meta — e funciona bem quando o prompt captura as restrições corretas.

Conceitos-chave:

Restrições como input; saída: plataforma recomendada + justificativa + ressalvas.

O que é:

Prompt de duas fases: 1) gerar código ou análise; 2) criticar o próprio output buscando falhas, inconsistências e casos não cobertos antes de entregar ao usuário.

Por que aprender:

Explorar ativamente a capacidade de autorrevisão do 4.8 é a forma de concretizar o ganho de ~4x menos falhas no fluxo de trabalho real.

Conceitos-chave:

Gerar → criticar → corrigir; duas chamadas ou um prompt de duas fases.

O que é:

Prompt que pede ao modelo para auditar um codebase de integração com a API 4.7, identificar o que precisa mudar para o 4.8 e gerar o diff de migração com explicações.

Por que aprender:

Usar o próprio 4.8 para migrar para o 4.8 é eficiente e demonstra as melhorias de autorrevisão na prática.

Conceitos-chave:

Input: código 4.7; output: diff + explicação + lista de o que revalidar.

O que é:

Prompt que pede ao modelo para gerar um checklist de validação personalizado para o seu caso de uso específico após migrar para o 4.8 — cobrindo evals, monitoramento e critérios de rollback.

Por que aprender:

Um checklist genérico não cobre todos os casos — usar o modelo para personalizar o checklist ao seu contexto aumenta a cobertura de validação.

Conceitos-chave:

Input: descrição do uso; output: checklist com critérios de sucesso + plano de rollback.

Ver Completo

⚡ Na prática

Mapa da trilha

⚡ Fast mode

🔀 Dynamic Workflows

🌐 Onde rodar

🛡️ Confiabilidade & segurança

🔄 Migrando para o 4.8

✏️ Exercícios da Trilha 3

📋 Prompts prontos da Trilha 3

Conteúdo detalhado

⚡ Fast mode

🔀 Dynamic Workflows

🌐 Onde rodar o Opus 4.8

🛡️ Confiabilidade & segurança

🔄 Migrando para o Opus 4.8

✏️ Exercícios da Trilha 3

📋 Prompts prontos da Trilha 3