MÓDULO 1.3

💸 Tokenizer e Custo Real

Por que sessões longas consomem mais, como medir com /usage e orçar com consciência.

7
Tópicos
30
Minutos
Básico
Nível
Economia
Tipo
CONSUMO DE TOKENS: 4.6 vs 4.7 — MESMA TAREFA 4.6 → 15k tokens 4 turnos • drip-feed 4.7 → 22k tokens 1 turno • briefing ICCA ↑ mais tokens por resposta, ↓ menos turnos totais, ↓ menos tempo humano
1

🔤 Tokenizer novo

O tokenizer foi atualizado no 4.7. Uma mesma string pode contabilizar número diferente de tokens em relação ao 4.6 — não é percentagem fixa, varia por conteúdo.

📊 Implicação prática

Comparações de benchmark 4.6 vs 4.7 precisam contar novamente. Não confie em cálculos salvos do 4.6.

2

📊 Sessões longas = mais tokens

A Anthropic destacou que o 4.7 tende a pensar mais em turnos posteriores de sessões longas. Isso melhora coerência, mas consome mais.

💡 Dica

Prefira sessões curtas e bem briefadas a sessões longas drip-fed. A Trilha 2 ensina como (framework ICCA).

3

💹 Medindo com /usage

O Claude Code tem um slash command novo: /usage. Mostra consumo da sessão atual e histórico recente.

/usage
# Output típico:
# Session: 12,430 tokens (in: 8,200 | out: 4,230)
# Today: 47,680 tokens
# Model: claude-opus-4-7
# Effort: xhigh
4

⚖️ Qualidade × tokens

A unidade correta é tokens por tarefa concluída, não por turno. O 4.7 custa mais por resposta mas geralmente precisa de menos turnos.

✗ Métrica enganosa

"4.7 consome 40% mais tokens por resposta" — sozinho não diz nada.

✓ Métrica real

"4.7 entrega a mesma feature em 22k tokens e 1 turno humano; 4.6 precisava de 30k e 4 turnos."

5

🧮 Orçamento por tipo de tarefa

TipoTokens típicos (4.7 xhigh)Suspeito se
Bug fix simples5–15k30k+
Feature média30–80k150k+
Refactor multi-arq100–300k600k+
Code review PR20–60k120k+
6

📉 Sinais de desperdício

✗ Sintomas

  • Sessões drip-fed com 8+ turnos humanos
  • Scaffolding "every N tool calls, summarize"
  • Mesmo arquivo sendo lido 3+ vezes
  • Contexto de conversas velhas ainda carregado

✓ Curas

  • Briefing ICCA (Trilha 2)
  • Auditoria de prompts (Trilha 4)
  • Compact proativo com hint
  • Sessão nova para tarefa nova
7

🏦 Boas práticas financeiras

📋 Resumo

Tokenizer novo — recontar antes de comparar
/usage — seu melhor amigo de medição
Tokens por tarefa — a unidade que importa
Orçamento baseline — sabe quando algo está errado

Próximo Módulo:

1.4 — De Pair Programmer a Engineering Manager