1.3 — Por que sua IA não gera resultado

🌪️ Bagunça amplificada

O erro mais comum de quem começa com IA é tratar o modelo como solução para a desorganização. A IA não conserta dado ruim — ela amplifica a bagunça em escala. Marco, ao conectar seu Shopify direto ao Claude sem preparo nenhum, recebeu análises rápidas, confiantes e completamente erradas sobre seus whales.

🧠 O princípio garbage-in-garbage-out, em escala

Em programação clássica, dado inválido causa erro visível. Com IA, dado inválido gera resposta plausível, fluente e errada — muito mais perigoso. Quatro formas de bagunça amplificada:

•Dados fragmentados — planilhas em 5 formatos diferentes viram "insights" contraditórios.
•Nomenclatura inconsistente — "cliente" vs "user" vs "comprador" gera duplicação invisível.
•Contexto ausente — número sem unidade, data sem fuso, valor sem moeda.
•Fontes desatualizadas — relatório de janeiro tratado como realidade de maio.

⚠️ Caso real: Marco e o P&L imaginário

Marco jogou 3 CSVs de fontes diferentes direto no Claude e pediu análise de lucratividade. O modelo respondeu com precisão de 2 casas decimais. O número estava errado em 34% porque dois arquivos usavam datas em formatos distintos e um incluía frete como receita. A IA não sinalizou o problema — entregou com confiança.

🎰 Improviso eterno

Cada sessão começando do zero, cada prompt escrito na hora, cada contexto reexplicado — isso não é usar IA, é operar uma loteria. O resultado depende de como você formulou hoje, do que lembrou de incluir, do seu humor. Não há repetibilidade, não há previsibilidade, não há sistema.

✓ Com sistema

✓CLAUDE.md define quem o agente é — uma vez, para sempre
✓Skills codificam SOPs — /brief executa o mesmo processo toda segunda
✓Silver Platters entregam contexto pré-processado — agente nunca lê dados brutos
✓Hooks disparam automaticamente — sem depender de lembrar

✗ Sem sistema

✗Cada conversa começa do zero — reexplicando empresa, contexto, tom
✗Qualidade depende do prompt do dia — variância alta, confiança baixa
✗Não há rastreabilidade — o que foi pedido? Quem aprovou? Quando?
✗Impossível delegar — o processo vive na cabeça de uma pessoa

💡 A virada: transformar improviso em SOP

Quando Sally Tan criou o skill /case-launch, o que levava 45 minutos de setup manual virou 3 minutos automatizados — e o resultado ficou mais consistente, não menos. O segredo: ela documentou o que fazia de cabeça e transformou em código declarativo.

🧱 Dado bruto vs. dado preparado

A diferença entre um agente que entrega valor real e um que gera ruído está em 80% no preparo dos dados, 20% no agente. Profissionais de dados sabem isso faz décadas — na era agêntica a máxima é ainda mais crítica porque o agente não sinaliza quando o dado é insuficiente.

🍽️ Pantry → Prep Table → Plate

A metáfora de cozinha que define o método PRATO (detalhado no módulo 1.5):

Pantry (despensa) — dados brutos onde estão: Shopify, iManage, EHR, CSVs, PDFs, APIs.
Prep Table (pré-preparo) — transformação: limpar, normalizar, resumir, estruturar.
Plate (prato) — Silver Platter: financeiro.md, clientes.md, casos.md — bandejas prontas para o agente servir.

# Silver Platter: financeiro.md
## Estado atual (atualizado: 2026-05-15)
- Receita semana: R$ 48.200
- Margem bruta: 41%
- Top 3 SKUs: mystery-gold, limited-drop-v2, collab-k
- Alerta: custo de frete +12% vs semana anterior

📊 Custo real do dado não preparado

3-5x mais tokens consumidos quando o agente lê dado bruto vs. resumo preparado
67% dos erros de agentes em produção são rastreados a dados de entrada inadequados (Anthropic, 2025)
Dra. Sana reduziu tempo de preparação de notas clínicas de 8 min para 90s depois de criar o Silver Platter de biópsias pendentes

🤹 Agente solto vs. hierarquia

Ter vários agentes sem hierarquia é como ter vários funcionários sem gerente — todos tentam fazer tudo, ninguém é responsável por nada, e a qualidade depende de quem respondeu mais rápido. Hierarquia não é burocracia; é o que torna a delegação segura.

🏗️ Orquestrador + especialistas

Chief-of-Staff (orquestrador) — recebe a pergunta, decide qual especialista acionar, sintetiza o resultado.
CFO Bot — analisa dados financeiros, custo, margem. Não toca em marketing.
CMO Bot — analisa voz do cliente, engajamento, campanha. Não toca em P&L.
Ops Bot — rastreia operações, SLAs, fornecedores. Não toca em finanças.

Resultado: Anthropic mediu 90,2% de melhora em qualidade de pesquisa com hierarquia vs. agente generalista solo.

⚠️ O anti-padrão "um agente para tudo"

Marco criou um único "Agente SlabHaus" e pediu que ele fizesse P&L, análise de TikTok, suporte ao cliente e planejamento de estoque — simultaneamente. O agente respondeu tudo, de forma superficial, sem profundidade em nenhuma área. Separar em especialistas reduziu o tempo de análise financeira de 12 para 3 minutos e aumentou a confiança da decisão.

🛡️ Segurança como esperança

A maioria das implementações confia que "o agente não vai fazer nada errado". Isso não é segurança — é torcer. Segurança real vem da arquitetura: escopo de pasta, permissões, hooks de validação, auditoria. Para a Dra. Sana, esperança não é opção legal nem ética.

🔒 Camadas de segurança arquitetural

•Path scoping — agente de billing só lê /billing/, nunca /phi/.
•ACL por ferramenta — CMO Bot não tem acesso a ferramentas financeiras, mesmo que tente.
•Hooks de validação — antes de qualquer ação irreversível, hook solicita confirmação humana.
•Audit trail — cada ação registrada com timestamp, agente, ferramenta e parâmetros.
•Modelo isolado para PHI — Dra. Sana usa AWS Bedrock em VPC isolada, dados nunca saem do ambiente.

📊 O custo real de um erro sem auditoria

No caso de Sally Tan, um agente sem audit trail acessou documentos de um caso conflitante durante pesquisa. Sem log, era impossível provar o que foi lido e quando. Com audit trail, o mesmo incidente teria sido detectado, contido e documentado em minutos.

HIPAA: multas de US$ 100 a US$ 50.000 por violação de PHI, por registro
OAB: conflito de interesse é causa de suspensão — sem log, defesa impossível
LGPD: até 2% do faturamento bruto por incidente de dados não rastreado

📊 Sem observabilidade não há melhoria

Você não pode melhorar o que não mede. Sem traces, evals e logs, você tem uma caixa preta que às vezes funciona e às vezes não — e você nunca sabe por quê. Operar sem observabilidade é aceitar que seu sistema vai degradar silenciosamente.

🔍 O que medir em um sistema agêntico

Traces — sequência completa de chamadas, ferramentas usadas, tokens consumidos por etapa.
Evals — avaliação sistemática da qualidade: o agente acertou? A decisão foi correta? Baseado em quê?
Latência p95 — quanto tempo o usuário espera no pior caso? É aceitável?
Custo por tarefa — quanto custa cada execução? Está dentro do orçamento de tokens?
Taxa de fallback humano — com que frequência o agente pede intervenção humana? Aumentando ou diminuindo?

💡 Ferramentas de observabilidade em 2026

LangSmith — tracing nativo para LangChain/LangGraph, dashboard de evals
Langfuse — open source, self-host, integra com qualquer SDK
Claude traces — Anthropic Console exibe custo, tempo e tool calls por sessão
Hooks de log — PostToolUse hook salva cada ação em JSONL local, custo zero

📋 Resumo do Módulo

✓

Bagunça amplificada — IA entrega resultado errado com confiança; dado ruim escala o problema

✓

Improviso eterno — sem CLAUDE.md, skills e hooks, cada sessão é uma loteria

✓

Dado bruto vs. preparado — Silver Platters são a ponte entre despensa e agente útil

✓

Agente solto vs. hierarquia — orquestrador + especialistas superam generalista em 90,2% dos casos

✓

Segurança arquitetural — path scoping, ACL, hooks de validação e audit trail, não esperança

✓

Observabilidade — traces, evals e logs são obrigatórios para quem quer melhorar

Próximo Módulo:

1.4 — As 3 personas: Marco, Sally e Dra. Sana

← Módulo Anterior ← Voltar para Trilha Próximo Módulo →