🌪️ Bagunça amplificada
O erro mais comum de quem começa com IA é tratar o modelo como solução para a desorganização. A IA não conserta dado ruim — ela amplifica a bagunça em escala. Marco, ao conectar seu Shopify direto ao Claude sem preparo nenhum, recebeu análises rápidas, confiantes e completamente erradas sobre seus whales.
🧠 O princípio garbage-in-garbage-out, em escala
Em programação clássica, dado inválido causa erro visível. Com IA, dado inválido gera resposta plausível, fluente e errada — muito mais perigoso. Quatro formas de bagunça amplificada:
- •Dados fragmentados — planilhas em 5 formatos diferentes viram "insights" contraditórios.
- •Nomenclatura inconsistente — "cliente" vs "user" vs "comprador" gera duplicação invisível.
- •Contexto ausente — número sem unidade, data sem fuso, valor sem moeda.
- •Fontes desatualizadas — relatório de janeiro tratado como realidade de maio.
⚠️ Caso real: Marco e o P&L imaginário
Marco jogou 3 CSVs de fontes diferentes direto no Claude e pediu análise de lucratividade. O modelo respondeu com precisão de 2 casas decimais. O número estava errado em 34% porque dois arquivos usavam datas em formatos distintos e um incluía frete como receita. A IA não sinalizou o problema — entregou com confiança.
🎰 Improviso eterno
Cada sessão começando do zero, cada prompt escrito na hora, cada contexto reexplicado — isso não é usar IA, é operar uma loteria. O resultado depende de como você formulou hoje, do que lembrou de incluir, do seu humor. Não há repetibilidade, não há previsibilidade, não há sistema.
✓ Com sistema
- ✓CLAUDE.md define quem o agente é — uma vez, para sempre
- ✓Skills codificam SOPs — /brief executa o mesmo processo toda segunda
- ✓Silver Platters entregam contexto pré-processado — agente nunca lê dados brutos
- ✓Hooks disparam automaticamente — sem depender de lembrar
✗ Sem sistema
- ✗Cada conversa começa do zero — reexplicando empresa, contexto, tom
- ✗Qualidade depende do prompt do dia — variância alta, confiança baixa
- ✗Não há rastreabilidade — o que foi pedido? Quem aprovou? Quando?
- ✗Impossível delegar — o processo vive na cabeça de uma pessoa
💡 A virada: transformar improviso em SOP
Quando Sally Tan criou o skill /case-launch, o que levava 45 minutos de setup manual virou 3 minutos automatizados — e o resultado ficou mais consistente, não menos. O segredo: ela documentou o que fazia de cabeça e transformou em código declarativo.
🧱 Dado bruto vs. dado preparado
A diferença entre um agente que entrega valor real e um que gera ruído está em 80% no preparo dos dados, 20% no agente. Profissionais de dados sabem isso faz décadas — na era agêntica a máxima é ainda mais crítica porque o agente não sinaliza quando o dado é insuficiente.
🍽️ Pantry → Prep Table → Plate
A metáfora de cozinha que define o método PRATO (detalhado no módulo 1.5):
- Pantry (despensa) — dados brutos onde estão: Shopify, iManage, EHR, CSVs, PDFs, APIs.
- Prep Table (pré-preparo) — transformação: limpar, normalizar, resumir, estruturar.
- Plate (prato) — Silver Platter: financeiro.md, clientes.md, casos.md — bandejas prontas para o agente servir.
## Estado atual (atualizado: 2026-05-15)
- Receita semana: R$ 48.200
- Margem bruta: 41%
- Top 3 SKUs: mystery-gold, limited-drop-v2, collab-k
- Alerta: custo de frete +12% vs semana anterior
📊 Custo real do dado não preparado
- 3-5x mais tokens consumidos quando o agente lê dado bruto vs. resumo preparado
- 67% dos erros de agentes em produção são rastreados a dados de entrada inadequados (Anthropic, 2025)
- Dra. Sana reduziu tempo de preparação de notas clínicas de 8 min para 90s depois de criar o Silver Platter de biópsias pendentes
🤹 Agente solto vs. hierarquia
Ter vários agentes sem hierarquia é como ter vários funcionários sem gerente — todos tentam fazer tudo, ninguém é responsável por nada, e a qualidade depende de quem respondeu mais rápido. Hierarquia não é burocracia; é o que torna a delegação segura.
🏗️ Orquestrador + especialistas
- Chief-of-Staff (orquestrador) — recebe a pergunta, decide qual especialista acionar, sintetiza o resultado.
- CFO Bot — analisa dados financeiros, custo, margem. Não toca em marketing.
- CMO Bot — analisa voz do cliente, engajamento, campanha. Não toca em P&L.
- Ops Bot — rastreia operações, SLAs, fornecedores. Não toca em finanças.
Resultado: Anthropic mediu 90,2% de melhora em qualidade de pesquisa com hierarquia vs. agente generalista solo.
⚠️ O anti-padrão "um agente para tudo"
Marco criou um único "Agente SlabHaus" e pediu que ele fizesse P&L, análise de TikTok, suporte ao cliente e planejamento de estoque — simultaneamente. O agente respondeu tudo, de forma superficial, sem profundidade em nenhuma área. Separar em especialistas reduziu o tempo de análise financeira de 12 para 3 minutos e aumentou a confiança da decisão.
🛡️ Segurança como esperança
A maioria das implementações confia que "o agente não vai fazer nada errado". Isso não é segurança — é torcer. Segurança real vem da arquitetura: escopo de pasta, permissões, hooks de validação, auditoria. Para a Dra. Sana, esperança não é opção legal nem ética.
🔒 Camadas de segurança arquitetural
- •Path scoping — agente de billing só lê
/billing/, nunca/phi/. - •ACL por ferramenta — CMO Bot não tem acesso a ferramentas financeiras, mesmo que tente.
- •Hooks de validação — antes de qualquer ação irreversível, hook solicita confirmação humana.
- •Audit trail — cada ação registrada com timestamp, agente, ferramenta e parâmetros.
- •Modelo isolado para PHI — Dra. Sana usa AWS Bedrock em VPC isolada, dados nunca saem do ambiente.
📊 O custo real de um erro sem auditoria
No caso de Sally Tan, um agente sem audit trail acessou documentos de um caso conflitante durante pesquisa. Sem log, era impossível provar o que foi lido e quando. Com audit trail, o mesmo incidente teria sido detectado, contido e documentado em minutos.
- HIPAA: multas de US$ 100 a US$ 50.000 por violação de PHI, por registro
- OAB: conflito de interesse é causa de suspensão — sem log, defesa impossível
- LGPD: até 2% do faturamento bruto por incidente de dados não rastreado
📊 Sem observabilidade não há melhoria
Você não pode melhorar o que não mede. Sem traces, evals e logs, você tem uma caixa preta que às vezes funciona e às vezes não — e você nunca sabe por quê. Operar sem observabilidade é aceitar que seu sistema vai degradar silenciosamente.
🔍 O que medir em um sistema agêntico
- Traces — sequência completa de chamadas, ferramentas usadas, tokens consumidos por etapa.
- Evals — avaliação sistemática da qualidade: o agente acertou? A decisão foi correta? Baseado em quê?
- Latência p95 — quanto tempo o usuário espera no pior caso? É aceitável?
- Custo por tarefa — quanto custa cada execução? Está dentro do orçamento de tokens?
- Taxa de fallback humano — com que frequência o agente pede intervenção humana? Aumentando ou diminuindo?
💡 Ferramentas de observabilidade em 2026
- LangSmith — tracing nativo para LangChain/LangGraph, dashboard de evals
- Langfuse — open source, self-host, integra com qualquer SDK
- Claude traces — Anthropic Console exibe custo, tempo e tool calls por sessão
- Hooks de log — PostToolUse hook salva cada ação em JSONL local, custo zero
📋 Resumo do Módulo
Próximo Módulo:
1.4 — As 3 personas: Marco, Sally e Dra. Sana