☁️ O que é OpenRouter
OpenRouter é um roteador de APIs que dá acesso a dezenas de modelos LLM, incluindo versões gratuitas de ponta.
OpenRouter é um gateway de API que unifica o acesso a dezenas de modelos LLM — GPT, Claude, Llama, Mistral, Qwen e mais — em um único endpoint compatível com a API da OpenAI.
Com OpenRouter você não precisa gerenciar múltiplas contas e chaves de API. Um único ponto de acesso para todos os modelos, com tier gratuito generoso.
Marketplace de modelos, API unificada, compatível com OpenAI, suporte a modelos :free sem custo por token.
Modelos com sufixo :free (ex: qwen/qwen3-coder:free) custam $0 por token. Você pode usar mesmo sem adicionar créditos à conta.
O tier gratuito permite usar Claude Code com modelos de alto desempenho sem custo algum. É a alternativa mais acessível para desenvolvimento.
Sufixo :free, $0 por token, disponível sem créditos, limite diário de requisições, não confundir com modelos pagos.
O OpenRouter limita requisições diárias nos modelos :free. Sem créditos: 50 req/dia. Com $10+ em créditos (mesmo não gastos): 1000 req/dia.
Entender os limites evita surpresas durante sessões longas de desenvolvimento. Com $10 uma vez você garante limites maiores permanentemente.
Reset à meia-noite UTC, $10 libera 1000 req/dia, créditos não são consumidos pelos modelos :free, apenas desbloqueiam limites maiores.
OpenRouter hospeda 100+ modelos: GPT-4o, Claude Sonnet, Llama 3, Mistral, Qwen, DeepSeek e muito mais. Tanto modelos open source quanto proprietários.
Conhecer o catálogo permite escolher o modelo ideal para cada tarefa — seja código, análise de texto, raciocínio ou tarefas gerais.
100+ modelos, open source e fechados, modelos :free disponíveis, filtrar por contexto e capacidade de tool use.
Criar uma conta gratuita em openrouter.ai. O processo envolve email e verificação, sem cartão de crédito obrigatório para o tier gratuito.
A conta é necessária para gerar API keys e monitorar o uso. Sem conta verificada, não é possível acessar os modelos.
openrouter.ai, Sign Up gratuito, verificação de email obrigatória, dashboard acessível após verificação.
A API Key é o token de autenticação que você usa no Claude Code. Ela começa com sk-or- e deve ser guardada com segurança.
Sem a API Key não é possível autenticar o Claude Code no OpenRouter. A chave só é exibida uma vez, por isso é crucial copiá-la imediatamente.
sk-or-... prefixo, exibida apenas uma vez, salvar em local seguro, não compartilhar publicamente, pode ser revogada e recriada.
🔧 Configuração Completa
Configure corretamente TODOS os slots de modelo para não ser cobrado acidentalmente por modelos em background.
Claude Code usa múltiplos modelos internamente — o principal para respostas e modelos menores (como Haiku) para tarefas internas de background. Se não configurados, usam o padrão pago da Anthropic.
Não configurar todos os slots é o erro mais comum que leva a cobranças inesperadas. Cada variável de ambiente mapeia um "slot" diferente do sistema.
Slots de modelo, Haiku em background, variáveis HAIKU, SONNET, OPUS, SUBAGENT e SMALL_FAST — todos precisam apontar para modelos :free.
As variáveis necessárias são: ANTHROPIC_BASE_URL (endpoint do OpenRouter), ANTHROPIC_AUTH_TOKEN (sua API key), ANTHROPIC_MODEL, DEFAULT_SONNET_MODEL, DEFAULT_OPUS_MODEL, DEFAULT_HAIKU_MODEL, SMALL_FAST_MODEL e CLAUDE_CODE_SUBAGENT_MODEL.
Cada variável controla um aspecto diferente do comportamento do Claude Code. Omitir qualquer uma pode fazer o sistema cair no modelo padrão pago.
8 variáveis obrigatórias, BASE_URL aponta para OpenRouter, AUTH_TOKEN é sua chave sk-or-, todas as variáveis de modelo devem usar :free.
No Linux/Mac, use export para definir variáveis de ambiente. Para persistência, adicione os exports ao arquivo ~/.bashrc ou ~/.zshrc.
exports no terminal são temporários (duram a sessão). Para configuração permanente, use o arquivo de profile do seu shell.
export VARIAVEL="valor", ~/.bashrc para bash, ~/.zshrc para zsh, source ~/.bashrc para aplicar sem reiniciar terminal.
No Windows, use setx no PowerShell para definir variáveis de ambiente permanentes. Requer abrir um novo terminal para que as mudanças entrem em vigor.
set é temporário, setx é permanente. Sem reiniciar o terminal após setx, as variáveis novas não serão visíveis.
setx VARIAVEL "valor", abrir novo PowerShell após configurar, System Properties > Environment Variables como alternativa gráfica.
O arquivo ~/.claude/settings.json permite configurar variáveis de ambiente permanentemente para o Claude Code, sem precisar alterar o shell do sistema.
É o método mais seguro e recomendado. Funciona em todos os sistemas operacionais, mantém configurações separadas do shell, e é fácil de versionar.
Bloco "env" no settings.json, caminho ~/.claude/settings.json, tem precedência sobre variáveis do shell, não requer restart.
O dashboard do OpenRouter (openrouter.ai/activity) mostra todas as requisições feitas, os modelos usados e o custo de cada uma. Você pode verificar se tudo está indo para modelos :free.
Verificar o dashboard após configurar é o único jeito de ter certeza que nenhuma requisição está indo para modelos pagos. Custo $0 confirma configuração correta.
openrouter.ai/activity, filtrar por modelo, custo total deve ser $0, verificar que nenhum modelo sem :free aparece nas chamadas.
🏆 Melhores Modelos Gratuitos
Os melhores modelos :free para código em abril 2026. Benchmarks, contexto e quando usar cada um.
Os critérios para selecionar um modelo para uso com Claude Code: janela de contexto mínima de 128K tokens, pontuação SWE-bench alta, e suporte nativo a tool use (function calling).
Claude Code envia projetos inteiros no contexto e usa tools para editar arquivos. Modelos sem esses requisitos falham silenciosamente ou truncam o contexto.
128K+ contexto obrigatório, SWE-bench mede capacidade de resolver bugs reais, tool use indispensável para Claude Code funcionar.
Qwen3-Coder é o modelo da Alibaba especializado em código. Com 262K de contexto e excelente desempenho no SWE-bench, é a melhor opção gratuita em abril 2026.
É a recomendação padrão para todos os slots de modelo. Funciona bem tanto para tarefas principais quanto para as internas de background do Claude Code.
262K contexto, especializado em código, suporte a tool use, alta pontuação SWE-bench, recomendado para todos os slots de variável.
Devstral-2 é o modelo da Mistral focado em desenvolvimento de software. Especializado em navegação de codebases multi-arquivo e refatoração complexa.
Para projetos grandes com muitos arquivos interdependentes, Devstral-2 se destaca por entender estrutura de projeto e fazer mudanças consistentes entre arquivos.
256K contexto, ótimo para multi-arquivo, desenvolvido pela Mistral para agentic coding, boa alternativa ao Qwen3-Coder.
Kimi K2.5 da Moonshot AI é um modelo equilibrado com 256K de contexto. Boa performance tanto em código quanto em tarefas gerais como análise e escrita.
Quando você usa Claude Code não apenas para código mas também para documentação, análise de requisitos e comunicação, Kimi K2.5 oferece equilíbrio entre essas tarefas.
256K contexto, equilibrado código/geral, boa opção para projetos mistos, terceira melhor opção gratuita disponível.
DeepSeek V3.1 da empresa chinesa DeepSeek. Com 131K de contexto, é o mais limitado entre os top 4, mas se destaca pela velocidade de inferência.
Para tarefas rápidas e projetos menores onde velocidade importa mais que contexto longo, DeepSeek V3.1 entrega respostas mais ágeis.
131K contexto (menor dos top 4), alta velocidade, boa para projetos pequenos, não recomendado para codebases grandes.
openrouter/auto:free é um modelo "roteador" que escolhe automaticamente qual modelo usar. Isso parece conveniente mas cria comportamento imprevisível e inconsistente.
Comportamento inconsistente em ferramentas de desenvolvimento é problemático. A mesma tarefa pode retornar resultados diferentes em sessões diferentes.
Evitar para uso com Claude Code, sempre especificar modelo explícito, imprevisibilidade atrapalha debugging, use um modelo fixo e confiável.
⚠️ Evitando Cobranças Acidentais
Entenda como cobranças acidentais acontecem e como se proteger completamente ao usar OpenRouter com Claude Code.
Cobranças acontecem quando o Claude Code faz uma chamada para um modelo sem o sufixo :free. Isso ocorre quando alguma variável de ambiente foi esquecida ou configurada incorretamente.
Entender o mecanismo de cobrança permite identificar e corrigir a causa raiz quando ela acontece, e preveni-la com configuração adequada.
Modelos sem :free cobram por token, configuração incompleta é a causa principal, verificação no dashboard identifica o modelo cobrado.
Claude Code foi projetado para usar Claude Haiku (o modelo mais barato da Anthropic) para tarefas internas como análise de contexto, sumários e operações de background.
Se ANTHROPIC_DEFAULT_HAIKU_MODEL não estiver configurado, o sistema tentará usar o Haiku real da Anthropic, gerando cobranças ocultas que você não vê diretamente nas respostas.
ANTHROPIC_DEFAULT_HAIKU_MODEL obrigatório, tarefas de background invisíveis ao usuário, pode gerar dezenas de chamadas por sessão.
A variável CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC=1 desativa chamadas de API que não são essenciais para a tarefa principal — como telemetria, análises de contexto opcionais e outros requests de background.
Reduz o número total de chamadas feitas ao OpenRouter, preservando seu limite diário de requisições e eliminando possíveis chamadas a modelos não configurados.
Valor 1 desativa, economiza requisições diárias, recomendado sempre que usar tier gratuito, pode ser configurado no settings.json.
Claude Code envia headers "beta" de prompt caching para a Anthropic por padrão. O OpenRouter não suporta esses headers, causando erros 400. DISABLE_PROMPT_CACHING=1 desativa esse comportamento.
Erros 400 misteriosos ao usar OpenRouter muitas vezes são causados por esses headers beta. Esta variável resolve o problema imediatamente.
Headers beta incompatíveis com OpenRouter, erros 400 como sintoma, DISABLE_PROMPT_CACHING=1 como solução, adicionar ao settings.json.
O dashboard de atividade do OpenRouter (openrouter.ai/activity) registra cada chamada de API com modelo usado, tokens consumidos e custo. É a fonte de verdade sobre o que está sendo usado.
Monitorar o dashboard após configurar e após cada sessão de trabalho confirma que tudo está funcionando como esperado. É sua principal ferramenta de verificação.
openrouter.ai/activity, verificar todos os modelos chamados, custo total deve ser $0, filtros por data e modelo disponíveis.
Versões mais novas do Claude Code podem introduzir mudanças de comportamento que quebram a compatibilidade com OpenRouter. Instalar uma versão específica e estável garante comportamento previsível.
Se após atualizar o Claude Code começar a ter erros com OpenRouter, fazer downgrade para uma versão estável conhecida resolve o problema rapidamente.
npm install -g com versão específica, @2.1.68 como versão estável conhecida, verificar com claude --version, manter versão estável em produção.