Modulo 5.1 - Assistentes e Multibots

🤖 Assistente Unico vs Multiplos

A primeira grande decisao ao construir uma plataforma de assistentes: um bot que faz tudo ou varios bots que fazem coisas especificas. Nao existe resposta universal. Existe a resposta certa pro seu caso.

🎯 Conceito Principal

Um assistente unico e como um canivete suico: faz tudo razoavelmente, mas nada excepcionalmente. Um sistema multibot e como uma equipe de especialistas: cada um e excelente no seu dominio, mas precisa de coordenacao.

A decisao depende de tres fatores: numero de dominios (quantas areas diferentes o bot precisa cobrir), profundidade (quao especialista precisa ser em cada area) e escala (quantos usuarios simultaneos).

• Bot unico: System prompt grande, todas as tools num lugar, contexto compartilhado. Funciona bem ate ~5 funcoes e ~100 usuarios
• Multiplos bots: Prompts focados, tools isoladas, contextos separados. Necessario quando tem dominios distintos com requisitos conflitantes
• Hibrido: Bot unico com routing interno. A mensagem entra num lugar, mas o processamento e delegado para modulos especializados

📊 Dados 2026

• 42% das empresas ja operam agentes em producao (McKinsey 2026)
• 67% dos projetos multibot usam arquitetura hub-and-spoke (router central + especialistas)
• 3.2x mais eficiente: bots especialistas vs generalistas na mesma tarefa (benchmark interno)
• Custo: multibot pode ser mais barato porque usa modelos menores e mais baratos por especialista

✓ Use Bot Unico quando

✓ Ate 5 funcoes no mesmo dominio
✓ Time pequeno (1-2 devs)
✓ MVP ou prova de conceito
✓ Contexto precisa ser 100% compartilhado

✗ Use Multiplos quando

✗ Dominios com requisitos conflitantes
✗ Precisam de modelos diferentes por funcao
✗ Escala exige processamento paralelo
✗ Isolamento de dados e obrigatorio

💡 Dica Pratica

Comece com bot unico. Migre para multibot quando doer. A complexidade de orquestrar multiplos bots so se justifica quando o bot unico comeca a dar respostas ruins por excesso de responsabilidades. Se voce precisa de system prompts radicalmente diferentes por funcao, ja esta na hora de separar.

🔀 Arquitetura Multibot

O coracao de um sistema multibot e o router. Ele recebe toda mensagem, classifica a intencao e despacha para o bot certo. Sem router, voce tem bots soltos. Com router, voce tem uma plataforma.

🎯 Conceito Principal

A arquitetura multibot segue o padrao hub-and-spoke: um router central (hub) conectado a multiplos pods especialistas (spokes). O router usa um LLM leve para classificar intencao e decidir para qual pod enviar.

Componentes essenciais: Router (classificacao de intencao), Pods (bots especialistas), Message Queue (fila de mensagens entre componentes), Health Monitor (verificacao de saude dos pods), Fallback Handler (quando nenhum pod se encaixa).

🔄 Fluxo de uma Mensagem no Sistema Multibot

📨

Entrada

Mensagem chega

🧠

Router

Classifica intencao

🔀

Despacho

Envia pro pod

🎯

Especialista

Processa tarefa

📤

Resposta

Retorna ao usuario

Se o pod falha, o router aciona o fallback automaticamente.

💻 Router Simplificado (pseudocodigo)

// Router classifica intencao com LLM leve

async function route(message) {

const intent = await classify(message) // ollama qwen2.5

switch(intent) {

case 'suporte': return supportBot.handle(message)

case 'vendas': return salesBot.handle(message)

case 'conteudo': return contentBot.handle(message)

default: return fallbackBot.handle(message)

}

📊 Metricas de Referencia

• Latencia do router: 200-500ms com LLM local (Ollama), 500-1500ms com API cloud
• Acuracia de classificacao: 90-95% com qwen2.5 ou llama3.2 fine-tuned para intencoes do dominio
• Fallback rate: ideal abaixo de 10%. Acima disso, suas categorias de intencao precisam de ajuste

💡 Dica Pratica

O router precisa ser rapido e barato. Use o modelo mais leve possivel para classificacao (qwen2.5:3b, llama3.2:1b). O especialista pode usar o modelo mais caro. Nao desperdice tokens de Claude ou GPT-4 pra decidir pra onde mandar a mensagem.

🎯 Bots Especialistas

Cada bot especialista e excelente em uma coisa e ignora todo o resto. Isso nao e limitacao. E design. Um bot de suporte que tenta vender confunde o usuario. Um bot de vendas que tenta dar suporte tecnico da informacao errada.

🎯 Conceito Principal

Um bot especialista e definido por tres coisas: system prompt focado (personalidade, tom, limites), tools especificas (capacidades do dominio) e modelo otimizado (o melhor modelo para aquela funcao ao melhor custo).

A especializacao melhora a qualidade porque o modelo recebe menos instrucoes conflitantes. Um system prompt de 200 palavras focado gera resultados melhores que um system prompt de 2000 palavras tentando cobrir 10 dominios.

📣

Bot de Marketing

Prompt: Tom persuasivo, foco em conversao, metricas de campanha

Tools: Analytics, gerador de copy, A/B test

Modelo: Claude Sonnet (criatividade + instrucoes)

💰

Bot de Vendas

Prompt: Qualificacao de leads, BANT, objecoes

Tools: CRM, pipeline, proposals

Modelo: GPT-4o (rapido, bom em conversacao)

🎧

Bot de Suporte

Prompt: Empatico, tecnico, resolucao rapida

Tools: Knowledge base, ticket system, FAQ

Modelo: Ollama local (privacidade, custo zero)

✍️

Bot de Conteudo

Prompt: Estilo da marca, SEO, formatos variados

Tools: Editor, imagens, scheduling, SEO analyzer

Modelo: Claude Sonnet (escrita de alta qualidade)

⚙️

Bot de Operacoes

Prompt: Preciso, tecnico, automacao de processos

Tools: Deploy, monitoring, backups, CI/CD

Modelo: DeepSeek-R1 (raciocinio, barato)

💡 Dica Pratica

Escolha o modelo pelo custo-beneficio da funcao, nao pelo hype. Suporte que responde FAQ nao precisa de Claude Opus. Um qwen2.5:14b local resolve com custo zero. Reserve os modelos caros para funcoes que realmente precisam de raciocinio avancado ou tools complexas.

🛠️ OpenClaw e ClaudeClaw

Frameworks open-source que implementam tudo o que discutimos ate agora: bot pessoal com IA, multi-agente, sessoes persistentes e integracao com Telegram. Em vez de comecar do zero, voce estuda e adapta arquiteturas que ja rodam em producao.

🎯 Conceito Principal

ClaudeClaw e um framework para construir bots pessoais que conectam o Claude Code ao Telegram. Voce conversa pelo celular e o bot executa tarefas na sua maquina: edita arquivos, roda comandos, acessa APIs, agenda tasks.

OpenClaw e a evolucao multi-agente. Em vez de um unico backend (Claude), ele orquestra multiplos: Ollama local, Codex CLI, OpenRouter. Um router classifica cada mensagem e despacha pro agente mais adequado. Dashboard de monitoramento, tracking de tokens, sessoes persistentes.

📐 Arquitetura ClaudeClaw

// Estrutura principal do projeto

claudeclaw/

├── src/

├── bot.ts // Telegram bot (polling/webhook)

├── agent.ts // Claude Agent SDK

├── router.ts // Classificacao de intencao

├── ollama.ts // Backend Ollama local

├── openrouter.ts // Backend OpenRouter API

├── codex.ts // Backend Codex CLI

└── dashboard.ts // Monitoring e metricas

├── store/

└── claudeclaw.db // SQLite: sessoes, memoria, tasks

├── CLAUDE.md // System prompt persistente

└── .env // Tokens e config

📊 ClaudeClaw vs OpenClaw

Feature	ClaudeClaw	OpenClaw
Backend	Claude only	Ollama + Codex + OpenRouter + Claude
Router	Comandos manuais (/claude)	LLM classifier automatico
Custo	$$$ (somente API)	$ (Ollama gratis + API quando necessario)
Dashboard	Basico	Completo (tokens, custo, latencia)
Complexidade	Baixa	Media

💡 Dica Pratica

CLAUDE.md e o segredo do bot inteligente. Ele funciona como system prompt persistente que viaja com toda conversa. Coloque la: quem voce e, como quer que o bot se comporte, quais tools tem, quais projetos trabalha. Quanto mais contexto, melhores as respostas.

📡 Integracao com Canais

Seu bot precisa estar onde o usuario esta. Nao adianta ter o melhor assistente do mundo se ele so funciona num terminal. Telegram, WhatsApp, web chat, Slack, Discord: cada canal tem suas regras, APIs e limitacoes.

🎯 Conceito Principal

Integracao multichannel funciona com o padrao adapter: cada canal tem um adapter que normaliza mensagens para um formato comum. O bot recebe sempre o mesmo formato, independente de onde a mensagem veio. A resposta passa pelo adapter reverso para formatar pro canal de saida.

Frameworks como LangBot e Botpress abstraem essa complexidade. Voce escreve a logica uma vez e conecta em 10+ plataformas. Para projetos menores, integrar direto com a API do Telegram (node-telegram-bot-api) e mais simples e tem controle total.

📱

• API gratuita e sem limites
• Suporta bots, inline, webhooks
• Markdown, arquivos ate 50MB
• Melhor opcao para bots pessoais

💬

• API paga (Meta Business)
• Janela de 24h para mensagens
• Templates pre-aprovados
• Melhor para atendimento comercial

🌐

Web Chat

• Widget no seu site/SaaS
• Controle total do design
• WebSocket para tempo real
• Melhor para SaaS e landing pages

🔧 Ferramentas Multichannel

LangBot

Open-source. Suporta 10+ plataformas (Telegram, WhatsApp, Discord, Slack, WeChat, Line, etc). Integra com qualquer LLM via API unificada. Self-hosted.

Botpress

Visual builder com 10 canais nativos. NLU integrado, analytics, versioning. Free tier generoso. Bom para times nao-tecnicos construirem bots.

Unified API (custom)

Construir seus proprios adapters por canal. Mais trabalho inicial, controle total. Ideal para projetos com requisitos especificos que frameworks nao atendem.

🚨 Cuidado com WhatsApp

A API oficial do WhatsApp (Meta Business) tem janela de 24h: voce so pode responder dentro de 24h da ultima mensagem do usuario. Depois disso, precisa usar templates pre-aprovados (e pagos). Bibliotecas nao-oficiais (baileys, whatsapp-web.js) podem funcionar, mas violam os termos de servico e seu numero pode ser banido.

💡 Dica Pratica

Comece com Telegram. API gratuita, sem limites, facil de programar, suporta tudo (texto, audio, arquivos, inline keyboards). Quando validar o produto, expanda para WhatsApp e web chat. Nao tente ser multichannel no MVP.

🏗️ Exercicio: Implementar Multibot

Hora de construir. Voce vai montar um sistema multibot funcional com router e pelo menos 2 bots especialistas. O objetivo e sair daqui com um sistema que classifica mensagens e despacha para o bot certo.

🏗️

Exercicio: Construa seu Multibot

Tempo estimado: 30-40 minutos

Defina 2-3 dominios do seu SaaS

Quais funcoes distintas o sistema precisa atender? Exemplo:

Dominio A: Suporte ao cliente (FAQ, tickets, troubleshooting)

Dominio B: Vendas (qualificacao, pricing, demos)

Dominio C: Conteudo (blog, social media, emails)

Crie o Router

Implemente a classificacao de intencao. Pode ser com LLM, regex ou keyword matching:

// Classificador de intencao simples

const prompt = `Classifique a mensagem em:

- suporte (duvidas, problemas, bugs)

- vendas (preco, plano, compra)

- outro (tudo mais)

Responda so a categoria.`

Implemente 2 Bots Especialistas

Cada bot com system prompt focado e pelo menos 1 tool especifica:

// Bot de Suporte

system: "Voce e um agente de suporte tecnico.

Seja empatico, resolva rapido. Consulte a FAQ."

// Bot de Vendas

system: "Voce e um consultor de vendas.

Qualifique o lead, apresente planos, agende demo."

Configure o Fallback

O que acontece quando nenhum bot se encaixa? Defina um handler padrao:

fallback: "Nao entendi sua solicitacao.

Posso ajudar com: suporte tecnico ou vendas."

Teste End-to-End

Envie 5 mensagens de cada tipo e verifique se o routing funciona:

Suporte: "meu login nao funciona" → Bot Suporte ✓

Vendas: "qual o preco do plano pro?" → Bot Vendas ✓

Fallback: "ola, tudo bem?" → Fallback ✓

✅ Criterios de Sucesso

☐ Router classifica intencoes corretamente

☐ 2+ bots especialistas funcionando

☐ Fallback handler implementado

☐ 5 mensagens de cada tipo testadas

🌟 Bonus

Adicione logging de routing para cada mensagem: timestamp, mensagem original, intencao classificada, bot selecionado, tempo de resposta. Isso vira seu dashboard de monitoramento e te mostra onde o router erra e onde os bots sao lentos.

📋 Resumo do Modulo

✓

Bot unico vs multiplos depende de dominios, profundidade e escala - Comece com um, migre quando a complexidade justificar.

✓

Arquitetura hub-and-spoke: router central + pods especialistas - O router deve ser rapido e barato. Use modelos leves para classificacao.

✓

Cada especialista tem: system prompt focado + tools especificas + modelo otimizado - Escolha o modelo pelo custo-beneficio da funcao.

✓

ClaudeClaw e OpenClaw sao referencias de arquitetura real - Estude, adapte e construa em cima. CLAUDE.md e a chave do bot inteligente.

✓

Comece com Telegram, expanda para multichannel depois - API gratuita, sem limites, perfeita pra MVP. WhatsApp e web chat vem na v2.

✓

Seu sistema multibot esta funcional - Router, 2+ especialistas, fallback. Pronto pra integrar com canais e escalar.

Proxima Trilha:

Trilha 6 - Seguranca, Billing e Operacao: deploy, pagamentos, seguranca e producao.

← Modulo Anterior Voltar para Trilha 5 Trilha 6: Operacao →