MODULO 5.1

🔗 Assistentes e Multibots

Construa plataformas de assistentes com arquitetura multibot. Router inteligente, bots especialistas por dominio, frameworks de referencia e integracao multichannel.

6
Topicos
~60min
Duracao
Avancado
Nivel
Teoria + Pratica
Tipo
1

🤖 Assistente Unico vs Multiplos

A primeira grande decisao ao construir uma plataforma de assistentes: um bot que faz tudo ou varios bots que fazem coisas especificas. Nao existe resposta universal. Existe a resposta certa pro seu caso.

🎯 Conceito Principal

Um assistente unico e como um canivete suico: faz tudo razoavelmente, mas nada excepcionalmente. Um sistema multibot e como uma equipe de especialistas: cada um e excelente no seu dominio, mas precisa de coordenacao.

A decisao depende de tres fatores: numero de dominios (quantas areas diferentes o bot precisa cobrir), profundidade (quao especialista precisa ser em cada area) e escala (quantos usuarios simultaneos).

  • Bot unico: System prompt grande, todas as tools num lugar, contexto compartilhado. Funciona bem ate ~5 funcoes e ~100 usuarios
  • Multiplos bots: Prompts focados, tools isoladas, contextos separados. Necessario quando tem dominios distintos com requisitos conflitantes
  • Hibrido: Bot unico com routing interno. A mensagem entra num lugar, mas o processamento e delegado para modulos especializados

📊 Dados 2026

  • 42% das empresas ja operam agentes em producao (McKinsey 2026)
  • 67% dos projetos multibot usam arquitetura hub-and-spoke (router central + especialistas)
  • 3.2x mais eficiente: bots especialistas vs generalistas na mesma tarefa (benchmark interno)
  • Custo: multibot pode ser mais barato porque usa modelos menores e mais baratos por especialista

✓ Use Bot Unico quando

  • Ate 5 funcoes no mesmo dominio
  • Time pequeno (1-2 devs)
  • MVP ou prova de conceito
  • Contexto precisa ser 100% compartilhado

✗ Use Multiplos quando

  • Dominios com requisitos conflitantes
  • Precisam de modelos diferentes por funcao
  • Escala exige processamento paralelo
  • Isolamento de dados e obrigatorio

💡 Dica Pratica

Comece com bot unico. Migre para multibot quando doer. A complexidade de orquestrar multiplos bots so se justifica quando o bot unico comeca a dar respostas ruins por excesso de responsabilidades. Se voce precisa de system prompts radicalmente diferentes por funcao, ja esta na hora de separar.

2

🔀 Arquitetura Multibot

O coracao de um sistema multibot e o router. Ele recebe toda mensagem, classifica a intencao e despacha para o bot certo. Sem router, voce tem bots soltos. Com router, voce tem uma plataforma.

🎯 Conceito Principal

A arquitetura multibot segue o padrao hub-and-spoke: um router central (hub) conectado a multiplos pods especialistas (spokes). O router usa um LLM leve para classificar intencao e decidir para qual pod enviar.

Componentes essenciais: Router (classificacao de intencao), Pods (bots especialistas), Message Queue (fila de mensagens entre componentes), Health Monitor (verificacao de saude dos pods), Fallback Handler (quando nenhum pod se encaixa).

🔄 Fluxo de uma Mensagem no Sistema Multibot

📨

Entrada

Mensagem chega

🧠

Router

Classifica intencao

🔀

Despacho

Envia pro pod

🎯

Especialista

Processa tarefa

📤

Resposta

Retorna ao usuario

Se o pod falha, o router aciona o fallback automaticamente.

💻 Router Simplificado (pseudocodigo)

// Router classifica intencao com LLM leve
async function route(message) {
const intent = await classify(message) // ollama qwen2.5
switch(intent) {
case 'suporte': return supportBot.handle(message)
case 'vendas': return salesBot.handle(message)
case 'conteudo': return contentBot.handle(message)
default: return fallbackBot.handle(message)
}
}

📊 Metricas de Referencia

  • Latencia do router: 200-500ms com LLM local (Ollama), 500-1500ms com API cloud
  • Acuracia de classificacao: 90-95% com qwen2.5 ou llama3.2 fine-tuned para intencoes do dominio
  • Fallback rate: ideal abaixo de 10%. Acima disso, suas categorias de intencao precisam de ajuste

💡 Dica Pratica

O router precisa ser rapido e barato. Use o modelo mais leve possivel para classificacao (qwen2.5:3b, llama3.2:1b). O especialista pode usar o modelo mais caro. Nao desperdice tokens de Claude ou GPT-4 pra decidir pra onde mandar a mensagem.

3

🎯 Bots Especialistas

Cada bot especialista e excelente em uma coisa e ignora todo o resto. Isso nao e limitacao. E design. Um bot de suporte que tenta vender confunde o usuario. Um bot de vendas que tenta dar suporte tecnico da informacao errada.

🎯 Conceito Principal

Um bot especialista e definido por tres coisas: system prompt focado (personalidade, tom, limites), tools especificas (capacidades do dominio) e modelo otimizado (o melhor modelo para aquela funcao ao melhor custo).

A especializacao melhora a qualidade porque o modelo recebe menos instrucoes conflitantes. Um system prompt de 200 palavras focado gera resultados melhores que um system prompt de 2000 palavras tentando cobrir 10 dominios.

📣

Bot de Marketing

Prompt: Tom persuasivo, foco em conversao, metricas de campanha
Tools: Analytics, gerador de copy, A/B test
Modelo: Claude Sonnet (criatividade + instrucoes)
💰

Bot de Vendas

Prompt: Qualificacao de leads, BANT, objecoes
Tools: CRM, pipeline, proposals
Modelo: GPT-4o (rapido, bom em conversacao)
🎧

Bot de Suporte

Prompt: Empatico, tecnico, resolucao rapida
Tools: Knowledge base, ticket system, FAQ
Modelo: Ollama local (privacidade, custo zero)
✍️

Bot de Conteudo

Prompt: Estilo da marca, SEO, formatos variados
Tools: Editor, imagens, scheduling, SEO analyzer
Modelo: Claude Sonnet (escrita de alta qualidade)
⚙️

Bot de Operacoes

Prompt: Preciso, tecnico, automacao de processos
Tools: Deploy, monitoring, backups, CI/CD
Modelo: DeepSeek-R1 (raciocinio, barato)

💡 Dica Pratica

Escolha o modelo pelo custo-beneficio da funcao, nao pelo hype. Suporte que responde FAQ nao precisa de Claude Opus. Um qwen2.5:14b local resolve com custo zero. Reserve os modelos caros para funcoes que realmente precisam de raciocinio avancado ou tools complexas.

4

🛠️ OpenClaw e ClaudeClaw

Frameworks open-source que implementam tudo o que discutimos ate agora: bot pessoal com IA, multi-agente, sessoes persistentes e integracao com Telegram. Em vez de comecar do zero, voce estuda e adapta arquiteturas que ja rodam em producao.

🎯 Conceito Principal

ClaudeClaw e um framework para construir bots pessoais que conectam o Claude Code ao Telegram. Voce conversa pelo celular e o bot executa tarefas na sua maquina: edita arquivos, roda comandos, acessa APIs, agenda tasks.

OpenClaw e a evolucao multi-agente. Em vez de um unico backend (Claude), ele orquestra multiplos: Ollama local, Codex CLI, OpenRouter. Um router classifica cada mensagem e despacha pro agente mais adequado. Dashboard de monitoramento, tracking de tokens, sessoes persistentes.

📐 Arquitetura ClaudeClaw

// Estrutura principal do projeto
claudeclaw/
├── src/
├── bot.ts // Telegram bot (polling/webhook)
├── agent.ts // Claude Agent SDK
├── router.ts // Classificacao de intencao
├── ollama.ts // Backend Ollama local
├── openrouter.ts // Backend OpenRouter API
├── codex.ts // Backend Codex CLI
└── dashboard.ts // Monitoring e metricas
├── store/
└── claudeclaw.db // SQLite: sessoes, memoria, tasks
├── CLAUDE.md // System prompt persistente
└── .env // Tokens e config

📊 ClaudeClaw vs OpenClaw

Feature ClaudeClaw OpenClaw
Backend Claude only Ollama + Codex + OpenRouter + Claude
Router Comandos manuais (/claude) LLM classifier automatico
Custo $$$ (somente API) $ (Ollama gratis + API quando necessario)
Dashboard Basico Completo (tokens, custo, latencia)
Complexidade Baixa Media

💡 Dica Pratica

CLAUDE.md e o segredo do bot inteligente. Ele funciona como system prompt persistente que viaja com toda conversa. Coloque la: quem voce e, como quer que o bot se comporte, quais tools tem, quais projetos trabalha. Quanto mais contexto, melhores as respostas.

5

📡 Integracao com Canais

Seu bot precisa estar onde o usuario esta. Nao adianta ter o melhor assistente do mundo se ele so funciona num terminal. Telegram, WhatsApp, web chat, Slack, Discord: cada canal tem suas regras, APIs e limitacoes.

🎯 Conceito Principal

Integracao multichannel funciona com o padrao adapter: cada canal tem um adapter que normaliza mensagens para um formato comum. O bot recebe sempre o mesmo formato, independente de onde a mensagem veio. A resposta passa pelo adapter reverso para formatar pro canal de saida.

Frameworks como LangBot e Botpress abstraem essa complexidade. Voce escreve a logica uma vez e conecta em 10+ plataformas. Para projetos menores, integrar direto com a API do Telegram (node-telegram-bot-api) e mais simples e tem controle total.

📱

Telegram

  • API gratuita e sem limites
  • Suporta bots, inline, webhooks
  • Markdown, arquivos ate 50MB
  • Melhor opcao para bots pessoais
💬

WhatsApp

  • API paga (Meta Business)
  • Janela de 24h para mensagens
  • Templates pre-aprovados
  • Melhor para atendimento comercial
🌐

Web Chat

  • Widget no seu site/SaaS
  • Controle total do design
  • WebSocket para tempo real
  • Melhor para SaaS e landing pages

🔧 Ferramentas Multichannel

LB

LangBot

Open-source. Suporta 10+ plataformas (Telegram, WhatsApp, Discord, Slack, WeChat, Line, etc). Integra com qualquer LLM via API unificada. Self-hosted.

BP

Botpress

Visual builder com 10 canais nativos. NLU integrado, analytics, versioning. Free tier generoso. Bom para times nao-tecnicos construirem bots.

UA

Unified API (custom)

Construir seus proprios adapters por canal. Mais trabalho inicial, controle total. Ideal para projetos com requisitos especificos que frameworks nao atendem.

🚨 Cuidado com WhatsApp

A API oficial do WhatsApp (Meta Business) tem janela de 24h: voce so pode responder dentro de 24h da ultima mensagem do usuario. Depois disso, precisa usar templates pre-aprovados (e pagos). Bibliotecas nao-oficiais (baileys, whatsapp-web.js) podem funcionar, mas violam os termos de servico e seu numero pode ser banido.

💡 Dica Pratica

Comece com Telegram. API gratuita, sem limites, facil de programar, suporta tudo (texto, audio, arquivos, inline keyboards). Quando validar o produto, expanda para WhatsApp e web chat. Nao tente ser multichannel no MVP.

6

🏗️ Exercicio: Implementar Multibot

Hora de construir. Voce vai montar um sistema multibot funcional com router e pelo menos 2 bots especialistas. O objetivo e sair daqui com um sistema que classifica mensagens e despacha para o bot certo.

🏗️

Exercicio: Construa seu Multibot

Tempo estimado: 30-40 minutos

1

Defina 2-3 dominios do seu SaaS

Quais funcoes distintas o sistema precisa atender? Exemplo:

Dominio A: Suporte ao cliente (FAQ, tickets, troubleshooting)
Dominio B: Vendas (qualificacao, pricing, demos)
Dominio C: Conteudo (blog, social media, emails)
2

Crie o Router

Implemente a classificacao de intencao. Pode ser com LLM, regex ou keyword matching:

// Classificador de intencao simples
const prompt = `Classifique a mensagem em:
- suporte (duvidas, problemas, bugs)
- vendas (preco, plano, compra)
- outro (tudo mais)
Responda so a categoria.`
3

Implemente 2 Bots Especialistas

Cada bot com system prompt focado e pelo menos 1 tool especifica:

// Bot de Suporte
system: "Voce e um agente de suporte tecnico.
Seja empatico, resolva rapido. Consulte a FAQ."
// Bot de Vendas
system: "Voce e um consultor de vendas.
Qualifique o lead, apresente planos, agende demo."
4

Configure o Fallback

O que acontece quando nenhum bot se encaixa? Defina um handler padrao:

fallback: "Nao entendi sua solicitacao.
Posso ajudar com: suporte tecnico ou vendas."
5

Teste End-to-End

Envie 5 mensagens de cada tipo e verifique se o routing funciona:

Suporte: "meu login nao funciona" → Bot Suporte ✓
Vendas: "qual o preco do plano pro?" → Bot Vendas ✓
Fallback: "ola, tudo bem?" → Fallback ✓

Criterios de Sucesso

Router classifica intencoes corretamente
2+ bots especialistas funcionando
Fallback handler implementado
5 mensagens de cada tipo testadas

🌟 Bonus

Adicione logging de routing para cada mensagem: timestamp, mensagem original, intencao classificada, bot selecionado, tempo de resposta. Isso vira seu dashboard de monitoramento e te mostra onde o router erra e onde os bots sao lentos.

📋 Resumo do Modulo

Bot unico vs multiplos depende de dominios, profundidade e escala - Comece com um, migre quando a complexidade justificar.
Arquitetura hub-and-spoke: router central + pods especialistas - O router deve ser rapido e barato. Use modelos leves para classificacao.
Cada especialista tem: system prompt focado + tools especificas + modelo otimizado - Escolha o modelo pelo custo-beneficio da funcao.
ClaudeClaw e OpenClaw sao referencias de arquitetura real - Estude, adapte e construa em cima. CLAUDE.md e a chave do bot inteligente.
Comece com Telegram, expanda para multichannel depois - API gratuita, sem limites, perfeita pra MVP. WhatsApp e web chat vem na v2.
Seu sistema multibot esta funcional - Router, 2+ especialistas, fallback. Pronto pra integrar com canais e escalar.

Proxima Trilha:

Trilha 6 - Seguranca, Billing e Operacao: deploy, pagamentos, seguranca e producao.