O maior erro em consultoria de IA não é não usar IA — é usar IA onde não precisa. A pirâmide de soluções é o framework decisor que o consultor usa em todo diagnóstico: cada andar tem seu perfil de custo, risco e adequação. Suba só quando o problema exigir.
Diagrama ilustrativo — a pirâmide de soluções: suba só quando o problema exigir.
🧱 Base: workflows determinísticos — barato, rápido, confiável
A base da pirâmide é onde a maioria das soluções deveria ficar. Determinístico significa previsível: dado o mesmo input, sempre o mesmo output. Regras, automação fixa, integrações via API, SaaS especializado, banco de dados estruturado.
✅ O que pertence à base
- •Regras de negócio fixas — "se pedido acima de R$ 500, frete grátis" → if/else, não LLM.
- •Automação de tarefas repetitivas — formulários, integrações Zapier/n8n, webhooks.
- •SaaS especializado — há um produto pronto que resolve exatamente esse problema.
- •Banco de dados e relatórios — queries SQL, dashboards, filtros.
💡 Por que a base é subestimada
A solução determinística não impressiona em apresentação. Mas é a mais barata de construir, a mais fácil de manter e a mais difícil de quebrar. Um cliente que economiza 20h/semana com uma automação simples é um cliente feliz — independente de ter IA ou não.
🤖 Meio: workflows com IA — mais poder, mais custo, mais pontos de falha
O andar do meio é onde a IA entra de forma cirúrgica: um passo do processo usa LLM; o restante do fluxo continua determinístico. É a camada de maior ROI quando bem aplicada, porque combina poder da IA com a estabilidade da automação fixa.
✓ Casos ideais para o meio
- ✓Classificar e-mails recebidos antes de distribuir
- ✓Extrair dados de documentos não estruturados (PDFs, contratos)
- ✓Gerar rascunho de resposta padrão para triagem humana
- ✓Resumir transcrições longas em pontos de ação
📊 O que muda vs. a base
- →Custo: APIs de LLM cobram por token — escala com volume
- →Latência: chamadas a LLM adicionam 1-5s ao fluxo
- →Falhas: alucinação, timeout, output fora do formato esperado
- →Supervisão: alguém precisa monitorar a qualidade do output
🛰️ Topo: agentes de IA — capacidade e risco máximos
Agentes são sistemas com autonomia para decidir e agir: recebem um objetivo, escolhem ferramentas, executam passos, observam resultados e iteram. O poder é máximo — e o risco também. Projetos de agente têm os maiores tempos de entrega e os maiores custos de manutenção.
🛰️ Quando agentes fazem sentido
- •Tarefa multi-passo complexa onde os passos dependem do resultado do anterior e não são conhecidos em tempo de design.
- •Uso de ferramentas — o agente precisa buscar na web, consultar banco de dados, chamar APIs ou executar código.
- •Loop de refinamento — o agente avalia o próprio output e itera até atingir critério de qualidade.
⚠️ Os riscos do topo
- Erro em cascata: uma decisão errada no passo 2 contamina todos os próximos passos.
- Custo imprevisível: loops longos multiplicam tokens e chamadas de ferramenta.
- Debugging difícil: o comportamento emergente é difícil de rastrear e reproduzir.
- Confiança do usuário: quando o agente erra de forma inesperada, o dano à confiança é maior.
📐 Os eixos: custo, tempo e risco crescem conforme sobe
A pirâmide não é só sobre complexidade técnica. É sobre três eixos de negócio que o cliente precisa entender antes de aprovar qualquer orçamento: custo, tempo de entrega e risco operacional.
📊 Os três eixos por andar
| Eixo | 🧱 Base | 🤖 Meio | 🛰️ Topo |
|---|---|---|---|
| Custo de build | Baixo | Médio | Alto |
| Custo de operação | Previsível | Escala com volume | Imprevisível |
| Tempo de entrega | Dias a semanas | Semanas | Meses |
| Risco de falha | Baixo | Médio | Alto |
| Manutenção | Simples | Moderada | Complexa |
💡 Use a tabela com o cliente
Mostrar esses eixos antes de qualquer proposta é uma forma de alinhar expectativas. O cliente que escolhe o topo sabendo do custo e do risco é um cliente preparado — e parceiro quando as coisas ficam difíceis.
🪜 A regra de ouro: comece na base, suba só quando exigir
A regra é simples e pouco respeitada: use o nível mais baixo da pirâmide que resolve o problema. Se a base resolve, ótimo. Se precisa de IA num passo, sobe um andar. Se precisa de agente, sobe dois. Mas nunca sobe sem ter tentado o de baixo.
✓ Aplicar a regra
- ✓Avalia se automação simples resolve antes de propor LLM
- ✓Propõe agente só quando multi-passo autônomo é necessário
- ✓Documenta o motivo de ter escolhido o nível X e não X-1
- ✓Começa pelo menor escopo que prova valor
✗ Quebrar a regra
- ✗Propõe agente para tarefa que uma regra simples resolve
- ✗Usa LLM para classificação binária com critérios fixos
- ✗Escolhe o nível pelo "wow factor" na apresentação
- ✗Não testa a solução mais simples por julgar insuficiente
🧪 Exemplos por nível — o mesmo problema em cada andar
O mesmo problema de negócio pode ser resolvido nos três andares — com perfis de custo, velocidade e robustez muito diferentes. Ver os três lados ajuda o cliente a escolher conscientemente, não por hype.
Problema: "Quero automatizar o atendimento de perguntas frequentes no WhatsApp"
🧱 Base (determinístico)
Menu de opções no WhatsApp Business API + FAQ em planilha + fluxo condicional por palavra-chave. Custo: R$ 500-2k/mês. Funciona para 80% das perguntas.
🤖 Meio (workflow com IA)
Fluxo base + LLM que entende variações da pergunta e gera resposta baseada na base de conhecimento (RAG). Custo: R$ 2-8k/mês. Cobre 95% das perguntas.
🛰️ Topo (agente)
Agente que consulta CRM, verifica pedido, negocia devoluções e escalona para humano com contexto completo. Custo: R$ 15-50k build + R$ 5-15k/mês. Necessário só para atendimento complexo com acesso a dados do cliente.
💡 O valor da comparação
Mostrar as três opções com custo e trade-offs é o que diferencia o consultor do vendedor. O vendedor só mostra a opção que ele vende. O consultor mostra as três e ajuda o cliente a escolher a certa para o contexto dele — hoje.
🎒 Resumo do módulo
Próximo módulo:
1.4 — Quando NÃO usar IA — e como isso constrói confiança