Trilha 4 - OpenRouter | Claude Code Open

Conteúdo Detalhado

4.1 ~20 min

☁️ O que é OpenRouter

OpenRouter é um roteador de APIs que dá acesso a dezenas de modelos LLM, incluindo versões gratuitas de ponta.

O que é:

OpenRouter é um gateway de API que unifica o acesso a dezenas de modelos LLM — GPT, Claude, Llama, Mistral, Qwen e mais — em um único endpoint compatível com a API da OpenAI.

Por que aprender:

Com OpenRouter você não precisa gerenciar múltiplas contas e chaves de API. Um único ponto de acesso para todos os modelos, com tier gratuito generoso.

Conceitos-chave:

Marketplace de modelos, API unificada, compatível com OpenAI, suporte a modelos :free sem custo por token.

O que é:

Modelos com sufixo :free (ex: qwen/qwen3-coder:free) custam $0 por token. Você pode usar mesmo sem adicionar créditos à conta.

Por que aprender:

O tier gratuito permite usar Claude Code com modelos de alto desempenho sem custo algum. É a alternativa mais acessível para desenvolvimento.

Conceitos-chave:

Sufixo :free, $0 por token, disponível sem créditos, limite diário de requisições, não confundir com modelos pagos.

O que é:

O OpenRouter limita requisições diárias nos modelos :free. Sem créditos: 50 req/dia. Com $10+ em créditos (mesmo não gastos): 1000 req/dia.

Por que aprender:

Entender os limites evita surpresas durante sessões longas de desenvolvimento. Com $10 uma vez você garante limites maiores permanentemente.

Conceitos-chave:

Reset à meia-noite UTC, $10 libera 1000 req/dia, créditos não são consumidos pelos modelos :free, apenas desbloqueiam limites maiores.

O que é:

OpenRouter hospeda 100+ modelos: GPT-4o, Claude Sonnet, Llama 3, Mistral, Qwen, DeepSeek e muito mais. Tanto modelos open source quanto proprietários.

Por que aprender:

Conhecer o catálogo permite escolher o modelo ideal para cada tarefa — seja código, análise de texto, raciocínio ou tarefas gerais.

Conceitos-chave:

100+ modelos, open source e fechados, modelos :free disponíveis, filtrar por contexto e capacidade de tool use.

O que é:

Criar uma conta gratuita em openrouter.ai. O processo envolve email e verificação, sem cartão de crédito obrigatório para o tier gratuito.

Por que aprender:

A conta é necessária para gerar API keys e monitorar o uso. Sem conta verificada, não é possível acessar os modelos.

Conceitos-chave:

openrouter.ai, Sign Up gratuito, verificação de email obrigatória, dashboard acessível após verificação.

O que é:

A API Key é o token de autenticação que você usa no Claude Code. Ela começa com sk-or- e deve ser guardada com segurança.

Por que aprender:

Sem a API Key não é possível autenticar o Claude Code no OpenRouter. A chave só é exibida uma vez, por isso é crucial copiá-la imediatamente.

Conceitos-chave:

sk-or-... prefixo, exibida apenas uma vez, salvar em local seguro, não compartilhar publicamente, pode ser revogada e recriada.

Ver Completo

4.2 ~30 min

🔧 Configuração Completa

Configure corretamente TODOS os slots de modelo para não ser cobrado acidentalmente por modelos em background.

O que é:

Claude Code usa múltiplos modelos internamente — o principal para respostas e modelos menores (como Haiku) para tarefas internas de background. Se não configurados, usam o padrão pago da Anthropic.

Por que aprender:

Não configurar todos os slots é o erro mais comum que leva a cobranças inesperadas. Cada variável de ambiente mapeia um "slot" diferente do sistema.

Conceitos-chave:

Slots de modelo, Haiku em background, variáveis HAIKU, SONNET, OPUS, SUBAGENT e SMALL_FAST — todos precisam apontar para modelos :free.

O que é:

As variáveis necessárias são: ANTHROPIC_BASE_URL (endpoint do OpenRouter), ANTHROPIC_AUTH_TOKEN (sua API key), ANTHROPIC_MODEL, DEFAULT_SONNET_MODEL, DEFAULT_OPUS_MODEL, DEFAULT_HAIKU_MODEL, SMALL_FAST_MODEL e CLAUDE_CODE_SUBAGENT_MODEL.

Por que aprender:

Cada variável controla um aspecto diferente do comportamento do Claude Code. Omitir qualquer uma pode fazer o sistema cair no modelo padrão pago.

Conceitos-chave:

8 variáveis obrigatórias, BASE_URL aponta para OpenRouter, AUTH_TOKEN é sua chave sk-or-, todas as variáveis de modelo devem usar :free.

O que é:

No Linux/Mac, use export para definir variáveis de ambiente. Para persistência, adicione os exports ao arquivo ~/.bashrc ou ~/.zshrc.

Por que aprender:

exports no terminal são temporários (duram a sessão). Para configuração permanente, use o arquivo de profile do seu shell.

Conceitos-chave:

export VARIAVEL="valor", ~/.bashrc para bash, ~/.zshrc para zsh, source ~/.bashrc para aplicar sem reiniciar terminal.

O que é:

No Windows, use setx no PowerShell para definir variáveis de ambiente permanentes. Requer abrir um novo terminal para que as mudanças entrem em vigor.

Por que aprender:

set é temporário, setx é permanente. Sem reiniciar o terminal após setx, as variáveis novas não serão visíveis.

Conceitos-chave:

setx VARIAVEL "valor", abrir novo PowerShell após configurar, System Properties > Environment Variables como alternativa gráfica.

O que é:

O arquivo ~/.claude/settings.json permite configurar variáveis de ambiente permanentemente para o Claude Code, sem precisar alterar o shell do sistema.

Por que aprender:

É o método mais seguro e recomendado. Funciona em todos os sistemas operacionais, mantém configurações separadas do shell, e é fácil de versionar.

Conceitos-chave:

Bloco "env" no settings.json, caminho ~/.claude/settings.json, tem precedência sobre variáveis do shell, não requer restart.

O que é:

O dashboard do OpenRouter (openrouter.ai/activity) mostra todas as requisições feitas, os modelos usados e o custo de cada uma. Você pode verificar se tudo está indo para modelos :free.

Por que aprender:

Verificar o dashboard após configurar é o único jeito de ter certeza que nenhuma requisição está indo para modelos pagos. Custo $0 confirma configuração correta.

Conceitos-chave:

openrouter.ai/activity, filtrar por modelo, custo total deve ser $0, verificar que nenhum modelo sem :free aparece nas chamadas.

Ver Completo

4.3 ~25 min

🏆 Melhores Modelos Gratuitos

Os melhores modelos :free para código em abril 2026. Benchmarks, contexto e quando usar cada um.

O que é:

Os critérios para selecionar um modelo para uso com Claude Code: janela de contexto mínima de 128K tokens, pontuação SWE-bench alta, e suporte nativo a tool use (function calling).

Por que aprender:

Claude Code envia projetos inteiros no contexto e usa tools para editar arquivos. Modelos sem esses requisitos falham silenciosamente ou truncam o contexto.

Conceitos-chave:

128K+ contexto obrigatório, SWE-bench mede capacidade de resolver bugs reais, tool use indispensável para Claude Code funcionar.

O que é:

Qwen3-Coder é o modelo da Alibaba especializado em código. Com 262K de contexto e excelente desempenho no SWE-bench, é a melhor opção gratuita em abril 2026.

Por que aprender:

É a recomendação padrão para todos os slots de modelo. Funciona bem tanto para tarefas principais quanto para as internas de background do Claude Code.

Conceitos-chave:

262K contexto, especializado em código, suporte a tool use, alta pontuação SWE-bench, recomendado para todos os slots de variável.

O que é:

Devstral-2 é o modelo da Mistral focado em desenvolvimento de software. Especializado em navegação de codebases multi-arquivo e refatoração complexa.

Por que aprender:

Para projetos grandes com muitos arquivos interdependentes, Devstral-2 se destaca por entender estrutura de projeto e fazer mudanças consistentes entre arquivos.

Conceitos-chave:

256K contexto, ótimo para multi-arquivo, desenvolvido pela Mistral para agentic coding, boa alternativa ao Qwen3-Coder.

O que é:

Kimi K2.5 da Moonshot AI é um modelo equilibrado com 256K de contexto. Boa performance tanto em código quanto em tarefas gerais como análise e escrita.

Por que aprender:

Quando você usa Claude Code não apenas para código mas também para documentação, análise de requisitos e comunicação, Kimi K2.5 oferece equilíbrio entre essas tarefas.

Conceitos-chave:

256K contexto, equilibrado código/geral, boa opção para projetos mistos, terceira melhor opção gratuita disponível.

O que é:

DeepSeek V3.1 da empresa chinesa DeepSeek. Com 131K de contexto, é o mais limitado entre os top 4, mas se destaca pela velocidade de inferência.

Por que aprender:

Para tarefas rápidas e projetos menores onde velocidade importa mais que contexto longo, DeepSeek V3.1 entrega respostas mais ágeis.

Conceitos-chave:

131K contexto (menor dos top 4), alta velocidade, boa para projetos pequenos, não recomendado para codebases grandes.

O que é:

openrouter/auto:free é um modelo "roteador" que escolhe automaticamente qual modelo usar. Isso parece conveniente mas cria comportamento imprevisível e inconsistente.

Por que aprender:

Comportamento inconsistente em ferramentas de desenvolvimento é problemático. A mesma tarefa pode retornar resultados diferentes em sessões diferentes.

Conceitos-chave:

Evitar para uso com Claude Code, sempre especificar modelo explícito, imprevisibilidade atrapalha debugging, use um modelo fixo e confiável.

Ver Completo

4.4 ~25 min

⚠️ Evitando Cobranças Acidentais

Entenda como cobranças acidentais acontecem e como se proteger completamente ao usar OpenRouter com Claude Code.

O que é:

Cobranças acontecem quando o Claude Code faz uma chamada para um modelo sem o sufixo :free. Isso ocorre quando alguma variável de ambiente foi esquecida ou configurada incorretamente.

Por que aprender:

Entender o mecanismo de cobrança permite identificar e corrigir a causa raiz quando ela acontece, e preveni-la com configuração adequada.

Conceitos-chave:

Modelos sem :free cobram por token, configuração incompleta é a causa principal, verificação no dashboard identifica o modelo cobrado.

O que é:

Claude Code foi projetado para usar Claude Haiku (o modelo mais barato da Anthropic) para tarefas internas como análise de contexto, sumários e operações de background.

Por que aprender:

Se ANTHROPIC_DEFAULT_HAIKU_MODEL não estiver configurado, o sistema tentará usar o Haiku real da Anthropic, gerando cobranças ocultas que você não vê diretamente nas respostas.

Conceitos-chave:

ANTHROPIC_DEFAULT_HAIKU_MODEL obrigatório, tarefas de background invisíveis ao usuário, pode gerar dezenas de chamadas por sessão.

O que é:

A variável CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1 desativa chamadas de API que não são essenciais para a tarefa principal — como telemetria, análises de contexto opcionais e outros requests de background.

Por que aprender:

Reduz o número total de chamadas feitas ao OpenRouter, preservando seu limite diário de requisições e eliminando possíveis chamadas a modelos não configurados.

Conceitos-chave:

Valor 1 desativa, economiza requisições diárias, recomendado sempre que usar tier gratuito, pode ser configurado no settings.json.

O que é:

Claude Code envia headers "beta" de prompt caching para a Anthropic por padrão. O OpenRouter não suporta esses headers, causando erros 400. DISABLE_PROMPT_CACHING=1 desativa esse comportamento.

Por que aprender:

Erros 400 misteriosos ao usar OpenRouter muitas vezes são causados por esses headers beta. Esta variável resolve o problema imediatamente.

Conceitos-chave:

Headers beta incompatíveis com OpenRouter, erros 400 como sintoma, DISABLE_PROMPT_CACHING=1 como solução, adicionar ao settings.json.

O que é:

O dashboard de atividade do OpenRouter (openrouter.ai/activity) registra cada chamada de API com modelo usado, tokens consumidos e custo. É a fonte de verdade sobre o que está sendo usado.

Por que aprender:

Monitorar o dashboard após configurar e após cada sessão de trabalho confirma que tudo está funcionando como esperado. É sua principal ferramenta de verificação.

Conceitos-chave:

openrouter.ai/activity, verificar todos os modelos chamados, custo total deve ser $0, filtros por data e modelo disponíveis.

O que é:

Versões mais novas do Claude Code podem introduzir mudanças de comportamento que quebram a compatibilidade com OpenRouter. Instalar uma versão específica e estável garante comportamento previsível.

Por que aprender:

Se após atualizar o Claude Code começar a ter erros com OpenRouter, fazer downgrade para uma versão estável conhecida resolve o problema rapidamente.

Conceitos-chave:

npm install -g com versão específica, @2.1.68 como versão estável conhecida, verificar com claude --version, manter versão estável em produção.

Ver Completo

← Trilha 3: Ollama Local Trilha 5: Na Prática →