🤖 Assistente Unico vs Multiplos
A primeira grande decisao ao construir uma plataforma de assistentes: um bot que faz tudo ou varios bots que fazem coisas especificas. Nao existe resposta universal. Existe a resposta certa pro seu caso.
🎯 Conceito Principal
Um assistente unico e como um canivete suico: faz tudo razoavelmente, mas nada excepcionalmente. Um sistema multibot e como uma equipe de especialistas: cada um e excelente no seu dominio, mas precisa de coordenacao.
A decisao depende de tres fatores: numero de dominios (quantas areas diferentes o bot precisa cobrir), profundidade (quao especialista precisa ser em cada area) e escala (quantos usuarios simultaneos).
- • Bot unico: System prompt grande, todas as tools num lugar, contexto compartilhado. Funciona bem ate ~5 funcoes e ~100 usuarios
- • Multiplos bots: Prompts focados, tools isoladas, contextos separados. Necessario quando tem dominios distintos com requisitos conflitantes
- • Hibrido: Bot unico com routing interno. A mensagem entra num lugar, mas o processamento e delegado para modulos especializados
📊 Dados 2026
- • 42% das empresas ja operam agentes em producao (McKinsey 2026)
- • 67% dos projetos multibot usam arquitetura hub-and-spoke (router central + especialistas)
- • 3.2x mais eficiente: bots especialistas vs generalistas na mesma tarefa (benchmark interno)
- • Custo: multibot pode ser mais barato porque usa modelos menores e mais baratos por especialista
✓ Use Bot Unico quando
- ✓ Ate 5 funcoes no mesmo dominio
- ✓ Time pequeno (1-2 devs)
- ✓ MVP ou prova de conceito
- ✓ Contexto precisa ser 100% compartilhado
✗ Use Multiplos quando
- ✗ Dominios com requisitos conflitantes
- ✗ Precisam de modelos diferentes por funcao
- ✗ Escala exige processamento paralelo
- ✗ Isolamento de dados e obrigatorio
💡 Dica Pratica
Comece com bot unico. Migre para multibot quando doer. A complexidade de orquestrar multiplos bots so se justifica quando o bot unico comeca a dar respostas ruins por excesso de responsabilidades. Se voce precisa de system prompts radicalmente diferentes por funcao, ja esta na hora de separar.
🔀 Arquitetura Multibot
O coracao de um sistema multibot e o router. Ele recebe toda mensagem, classifica a intencao e despacha para o bot certo. Sem router, voce tem bots soltos. Com router, voce tem uma plataforma.
🎯 Conceito Principal
A arquitetura multibot segue o padrao hub-and-spoke: um router central (hub) conectado a multiplos pods especialistas (spokes). O router usa um LLM leve para classificar intencao e decidir para qual pod enviar.
Componentes essenciais: Router (classificacao de intencao), Pods (bots especialistas), Message Queue (fila de mensagens entre componentes), Health Monitor (verificacao de saude dos pods), Fallback Handler (quando nenhum pod se encaixa).
🔄 Fluxo de uma Mensagem no Sistema Multibot
Entrada
Mensagem chega
Router
Classifica intencao
Despacho
Envia pro pod
Especialista
Processa tarefa
Resposta
Retorna ao usuario
Se o pod falha, o router aciona o fallback automaticamente.
💻 Router Simplificado (pseudocodigo)
📊 Metricas de Referencia
- • Latencia do router: 200-500ms com LLM local (Ollama), 500-1500ms com API cloud
- • Acuracia de classificacao: 90-95% com qwen2.5 ou llama3.2 fine-tuned para intencoes do dominio
- • Fallback rate: ideal abaixo de 10%. Acima disso, suas categorias de intencao precisam de ajuste
💡 Dica Pratica
O router precisa ser rapido e barato. Use o modelo mais leve possivel para classificacao (qwen2.5:3b, llama3.2:1b). O especialista pode usar o modelo mais caro. Nao desperdice tokens de Claude ou GPT-4 pra decidir pra onde mandar a mensagem.
🎯 Bots Especialistas
Cada bot especialista e excelente em uma coisa e ignora todo o resto. Isso nao e limitacao. E design. Um bot de suporte que tenta vender confunde o usuario. Um bot de vendas que tenta dar suporte tecnico da informacao errada.
🎯 Conceito Principal
Um bot especialista e definido por tres coisas: system prompt focado (personalidade, tom, limites), tools especificas (capacidades do dominio) e modelo otimizado (o melhor modelo para aquela funcao ao melhor custo).
A especializacao melhora a qualidade porque o modelo recebe menos instrucoes conflitantes. Um system prompt de 200 palavras focado gera resultados melhores que um system prompt de 2000 palavras tentando cobrir 10 dominios.
Bot de Marketing
Bot de Vendas
Bot de Suporte
Bot de Conteudo
Bot de Operacoes
💡 Dica Pratica
Escolha o modelo pelo custo-beneficio da funcao, nao pelo hype. Suporte que responde FAQ nao precisa de Claude Opus. Um qwen2.5:14b local resolve com custo zero. Reserve os modelos caros para funcoes que realmente precisam de raciocinio avancado ou tools complexas.
🛠️ OpenClaw e ClaudeClaw
Frameworks open-source que implementam tudo o que discutimos ate agora: bot pessoal com IA, multi-agente, sessoes persistentes e integracao com Telegram. Em vez de comecar do zero, voce estuda e adapta arquiteturas que ja rodam em producao.
🎯 Conceito Principal
ClaudeClaw e um framework para construir bots pessoais que conectam o Claude Code ao Telegram. Voce conversa pelo celular e o bot executa tarefas na sua maquina: edita arquivos, roda comandos, acessa APIs, agenda tasks.
OpenClaw e a evolucao multi-agente. Em vez de um unico backend (Claude), ele orquestra multiplos: Ollama local, Codex CLI, OpenRouter. Um router classifica cada mensagem e despacha pro agente mais adequado. Dashboard de monitoramento, tracking de tokens, sessoes persistentes.
📐 Arquitetura ClaudeClaw
📊 ClaudeClaw vs OpenClaw
| Feature | ClaudeClaw | OpenClaw |
|---|---|---|
| Backend | Claude only | Ollama + Codex + OpenRouter + Claude |
| Router | Comandos manuais (/claude) | LLM classifier automatico |
| Custo | $$$ (somente API) | $ (Ollama gratis + API quando necessario) |
| Dashboard | Basico | Completo (tokens, custo, latencia) |
| Complexidade | Baixa | Media |
💡 Dica Pratica
CLAUDE.md e o segredo do bot inteligente. Ele funciona como system prompt persistente que viaja com toda conversa. Coloque la: quem voce e, como quer que o bot se comporte, quais tools tem, quais projetos trabalha. Quanto mais contexto, melhores as respostas.
📡 Integracao com Canais
Seu bot precisa estar onde o usuario esta. Nao adianta ter o melhor assistente do mundo se ele so funciona num terminal. Telegram, WhatsApp, web chat, Slack, Discord: cada canal tem suas regras, APIs e limitacoes.
🎯 Conceito Principal
Integracao multichannel funciona com o padrao adapter: cada canal tem um adapter que normaliza mensagens para um formato comum. O bot recebe sempre o mesmo formato, independente de onde a mensagem veio. A resposta passa pelo adapter reverso para formatar pro canal de saida.
Frameworks como LangBot e Botpress abstraem essa complexidade. Voce escreve a logica uma vez e conecta em 10+ plataformas. Para projetos menores, integrar direto com a API do Telegram (node-telegram-bot-api) e mais simples e tem controle total.
Telegram
- • API gratuita e sem limites
- • Suporta bots, inline, webhooks
- • Markdown, arquivos ate 50MB
- • Melhor opcao para bots pessoais
- • API paga (Meta Business)
- • Janela de 24h para mensagens
- • Templates pre-aprovados
- • Melhor para atendimento comercial
Web Chat
- • Widget no seu site/SaaS
- • Controle total do design
- • WebSocket para tempo real
- • Melhor para SaaS e landing pages
🔧 Ferramentas Multichannel
LangBot
Open-source. Suporta 10+ plataformas (Telegram, WhatsApp, Discord, Slack, WeChat, Line, etc). Integra com qualquer LLM via API unificada. Self-hosted.
Botpress
Visual builder com 10 canais nativos. NLU integrado, analytics, versioning. Free tier generoso. Bom para times nao-tecnicos construirem bots.
Unified API (custom)
Construir seus proprios adapters por canal. Mais trabalho inicial, controle total. Ideal para projetos com requisitos especificos que frameworks nao atendem.
🚨 Cuidado com WhatsApp
A API oficial do WhatsApp (Meta Business) tem janela de 24h: voce so pode responder dentro de 24h da ultima mensagem do usuario. Depois disso, precisa usar templates pre-aprovados (e pagos). Bibliotecas nao-oficiais (baileys, whatsapp-web.js) podem funcionar, mas violam os termos de servico e seu numero pode ser banido.
💡 Dica Pratica
Comece com Telegram. API gratuita, sem limites, facil de programar, suporta tudo (texto, audio, arquivos, inline keyboards). Quando validar o produto, expanda para WhatsApp e web chat. Nao tente ser multichannel no MVP.
🏗️ Exercicio: Implementar Multibot
Hora de construir. Voce vai montar um sistema multibot funcional com router e pelo menos 2 bots especialistas. O objetivo e sair daqui com um sistema que classifica mensagens e despacha para o bot certo.
Exercicio: Construa seu Multibot
Tempo estimado: 30-40 minutos
Defina 2-3 dominios do seu SaaS
Quais funcoes distintas o sistema precisa atender? Exemplo:
Crie o Router
Implemente a classificacao de intencao. Pode ser com LLM, regex ou keyword matching:
Implemente 2 Bots Especialistas
Cada bot com system prompt focado e pelo menos 1 tool especifica:
Configure o Fallback
O que acontece quando nenhum bot se encaixa? Defina um handler padrao:
Teste End-to-End
Envie 5 mensagens de cada tipo e verifique se o routing funciona:
✅ Criterios de Sucesso
🌟 Bonus
Adicione logging de routing para cada mensagem: timestamp, mensagem original, intencao classificada, bot selecionado, tempo de resposta. Isso vira seu dashboard de monitoramento e te mostra onde o router erra e onde os bots sao lentos.
📋 Resumo do Modulo
Proxima Trilha:
Trilha 6 - Seguranca, Billing e Operacao: deploy, pagamentos, seguranca e producao.