🎯 Como Escolher um Modelo para Claude Code
Nem todo modelo LLM funciona bem com Claude Code. Existem três critérios obrigatórios que qualquer modelo precisa atender para ser viável na prática.
Contexto mínimo 128K
Claude Code envia projetos inteiros no contexto. Modelos com janelas menores truncam o código e geram respostas incorretas.
SWE-bench alto
SWE-bench mede a capacidade de resolver bugs reais em repositórios open source. É o benchmark mais relevante para uso com Claude Code.
Tool use nativo
Claude Code usa function calling para editar arquivos, executar comandos e buscar informações. Sem suporte a tools, o sistema não funciona.
📊 Por que esses critérios?
- •128K contexto — um projeto médio com 50 arquivos facilmente supera 32K tokens
- •SWE-bench — modelos com <30% resolvem apenas bugs triviais, inútil para trabalho real
- •Tool use — sem isso, Claude Code fica limitado a apenas gerar texto, sem poder editar arquivos
🥇 qwen/qwen3-coder:free
O Qwen3-Coder da Alibaba é a melhor escolha geral para Claude Code em abril 2026. Com 262K de contexto e treinamento especializado em código, supera modelos muito maiores em tarefas de desenvolvimento.
🥇 Ficha Técnica: Qwen3-Coder
💡 Quando Usar
- ✓Desenvolvimento de features novas em projetos existentes
- ✓Refatoração de código e melhorias de qualidade
- ✓Debug de bugs complexos que envolvem múltiplos arquivos
- ✓Configuração padrão para todos os slots de modelo
🥈 mistralai/devstral-2:free
Devstral-2 da Mistral AI foi desenvolvido especificamente para agentic software development. Excelente para navegar e modificar codebases com muitos arquivos interdependentes.
🥈 Ficha Técnica: Devstral-2
💡 Quando Usar
- ✓Projetos grandes com muitos arquivos interdependentes
- ✓Migrações e refatorações que afetam toda a codebase
- ✓Quando Qwen3-Coder tiver atingido limite diário
- ✓Segunda melhor opção como fallback
🥉 moonshotai/kimi-k2.5:free
Kimi K2.5 da Moonshot AI é um modelo equilibrado que se destaca quando você precisa de mais do que apenas código — análise de requisitos, documentação técnica e tarefas mistas.
🥉 Ficha Técnica: Kimi K2.5
💡 Quando Usar
- ✓Projetos que misturam código e conteúdo técnico
- ✓Análise de requisitos e planejamento de arquitetura
- ✓Quando os dois primeiros estiverem com limite atingido
- ✓Tarefas onde a qualidade de texto importa tanto quanto código
4️⃣ deepseek/deepseek-v3.1:free
DeepSeek V3.1 tem o menor contexto entre os top 4, mas compensa com velocidade de resposta superior. Bom para projetos menores onde agilidade é mais importante que janela de contexto.
4️⃣ Ficha Técnica: DeepSeek V3.1
❌ O Que Evitar
Além de escolher os melhores modelos, é importante saber o que evitar para não ter problemas com Claude Code.
❌ openrouter/auto:free — Evitar
Parece conveniente deixar o OpenRouter escolher automaticamente, mas gera problemas sérios:
- ✗Usa modelos aleatórios — comportamento imprevisível entre sessões
- ✗Pode escolher modelos sem tool use — Claude Code para de funcionar
- ✗Dificulta debugging — não sabe qual modelo causou o problema
- ✗Pode rotear para modelos pagos sem aviso
Comparativo Final — Top 4 Gratuitos
| Modelo | Contexto | SWE-bench | Melhor Para |
|---|---|---|---|
| qwen3-coder:free | 262K | ~72% | Geral — recomendado padrão |
| devstral-2:free | 256K | ~68% | Projetos multi-arquivo |
| kimi-k2.5:free | 256K | ~65% | Código + conteúdo geral |
| deepseek-v3.1:free | 131K | ~60% | Projetos pequenos, velocidade |
✅ Resumo do Módulo 4.3
Próximo Módulo:
4.4 — ⚠️ Evitando Cobranças Acidentais — como se proteger completamente