MÓDULO 2.4

🪟 Memória, Contexto, Sandbox e Worktrees

A camada operacional do agente: como gerenciar a janela de contexto, salvar memória persistente, escolher o sandbox certo e isolar tarefas em worktrees para multiagente real sem conflito.

6
Tópicos
60
Minutos
Core
Nível
Ops
Tipo
1

🪟 Janela de Contexto

A janela de contexto é o que o agente lembra na sessão atual. GPT 5.5 Codex tem 1 milhão de tokens. Mas mesmo com isso, ela enche — e Codex compacta automaticamente quando enche. Saber ler os sinais de degradação é importante.

📊 Como o contexto preenche

AGENTS.md Skills Tools Conversa atual Folga ~50k ~30k ~20k ~600k (cresce) ~300k 0 1M tokens Quando "Conversa atual" passa de 600k, Codex compacta o histórico antigo

🚨 Sinais de contexto degradado

  • ⚠️Esquecimento de regra recente — agente reintroduz padrão que você corrigiu há 30 mensagens.
  • ⚠️Contradição com decisão anterior — sugere abordagem que vocês tinham descartado juntos.
  • ⚠️Perda de tom — começou direto, virou prolixo e pedindo confirmação a cada passo.
  • ⚠️Re-leitura desnecessária — abre arquivos que já estavam no contexto.

📌 Quando abrir nova sessão

Sentiu 2 desses sinais? Faça handoff e abra sessão nova. Peça ao agente: "resuma o que foi feito, decisões, próximos passos". Cole isso na nova sessão. Você perde 2 minutos e ganha 2 horas de produtividade limpa.

2

💾 Memory Persistente

Memória que sobrevive entre sessões. Você salva fatos sobre você (preferências, atalhos, padrões); o agente recupera no próximo chat. Mas memória inchada vira ruído — gerenciar é parte do método.

✅ Bom de salvar

  • • Stack preferida (Bun, Tailwind, Convex)
  • • Tom de comunicação (direto, sem emoji)
  • • Cliente recorrente e contexto comercial
  • • Atalhos pessoais ("PR padrão" = template X)
  • • Fuso horário, idioma, formato de data

❌ Ruim de salvar

  • • Detalhes de tarefa pontual
  • • Erros temporários ("hoje o servidor caiu")
  • • Decisões de projeto específico (vão pro AGENTS.md)
  • • Rascunhos de texto
  • • Senhas, tokens, secrets (NUNCA)
comandos de memória — Codex
você: lembre que eu uso Bun em todos os projetos novos
agente: ✓ salvo em memória global

você: o que você lembra sobre mim?
agente: 1. Usa Bun em projetos novos
            2. Tom direto, sem emoji
            3. Cliente principal: clínicas de estética em SP
            4. Fuso BRT, formato data DD/MM/AAAA

você: esquece o item 3, mudei de nicho
agente: ✓ removido

📌 Auditoria mensal

Toda primeira segunda do mês, peça: "liste tudo o que você lembra sobre mim". Leia. O que está obsoleto, mande remover. Memória limpa = agente afiado. Memória poluída = sugestões fora de contexto.

3

🔒 Sandbox: Read-only / Edit / Full-access

Codex permite restringir o que o agente faz no sistema: só ler, editar arquivos, ou ter acesso total (rodar comandos, instalar). Calibrar por contexto é segurança operacional.

📖

Read-only

Lê arquivos. Nada além disso.

Quando: auditoria, code review, exploração de codebase desconhecida.
✏️

Edit

Lê + edita arquivos. Não roda comando.

Quando: código de cliente, projeto sensível, ambiente compartilhado.
🚀

Full-access

Tudo: edita, roda shell, instala, deploya.

Quando: projeto novo, sandbox isolada, worktree dedicada.

⚠️ Riscos de full-access em código de cliente

  • Agente roda rm -rf node_modules e tira a app do ar.
  • Instala lib aleatória que infla bundle e quebra deploy de produção.
  • Faz git push --force em main e perde commits.
  • Roda drop table em migration sem rollback testado.

📌 Heurística do blast radius

Pergunta: "se o agente fizer besteira agora, o que quebra?". Se a resposta é "nada — é projeto novo na minha pasta": full-access. Se é "produção do meu cliente paga R$ 197/mês": edit. Se é "código do cliente de outra agência": read-only.

4

🌳 Worktrees do Git

git worktree add cria uma nova pasta com uma branch checada. Cada agente trabalha numa worktree própria. Sem stash, sem trocar branch, sem conflito.

📁 Layout: 4 agentes, 4 worktrees

📁 ~/projetos/inboxai/ # worktree principal — main
📁 ~/projetos/inboxai-feature-auth/ # agente 1 — feat/auth
📁 ~/projetos/inboxai-feature-billing/ # agente 2 — feat/billing
📁 ~/projetos/inboxai-bugfix-email/ # agente 3 — fix/email-parser
📁 ~/projetos/inboxai-refactor-db/ # agente 4 — refactor/queries
terminal — comandos práticos
# criar uma worktree em pasta nova com branch nova
$ git worktree add ../inboxai-feature-auth feat/auth

# listar worktrees
$ git worktree list
  /home/nei/projetos/inboxai            abc1234 [main]
  /home/nei/projetos/inboxai-feature-auth   def5678 [feat/auth]
  /home/nei/projetos/inboxai-feature-billing 9876fed [feat/billing]

# quando terminar, remover
$ git worktree remove ../inboxai-feature-auth

# prune se algo ficou orfao
$ git worktree prune

📌 Por que isso é game changer

Sem worktree, multiagente é teoria. Com worktree, é prática diária: você abre 4 abas do app Codex, cada uma apontando pra uma pasta diferente, cada uma com um agente trabalhando em paralelo. À noite, faz merge das 4 branches. Seu output 4x.

5

🤖 Sub-agents

Sub-agente é um agente filho que recebe uma tarefa fechada e devolve o resultado. Útil para paralelismo e isolamento de contexto. Tem overhead — saber a hora certa é a diferença entre 4x mais rápido e 2x mais lento.

🎯 Quando delegar a um sub-agent

Cenário Delegar? Por quê
Pesquisar 5 arquivos em paralelo✓ simParalelismo real, ganha tempo
Tarefa que polui contexto principal✓ simSub-agent isola, devolve só resumo
Auditoria longa de codebase✓ simResultado caberia em 30k tokens; resumo em 1k
Editar 1 arquivo simples✗ nãoOverhead de delegar > benefício
Tarefa interativa que precisa de você✗ nãoSub-agent não te pergunta, vai assumir

⚖️ Custo do sub-agent

  • ⏱️Setup: ~5–10s para spin-up. Tarefa de 30s não compensa.
  • 📡Sem contexto compartilhado: precisa receber tudo no prompt inicial.
  • 💸Custo de tokens: sub-agent reabre contexto, AGENTS.md, skills.
  • Ganho: isolamento + paralelismo + contexto principal limpo.

📌 Regra dos 5 minutos

Tarefa que demoraria menos de 5 minutos no agente principal: faça lá. Tarefa que demoraria mais de 5 minutos e dá pra paralelizar ou poluiria contexto: delega pra sub-agent. É a heurística mais simples e funciona em 90% dos casos.

6

⚠️ Erros Caros Multiagente

Os três acidentes clássicos. Cada um pode custar horas de retrabalho ou pior — perda de dados de cliente. Reconhecer o padrão antes de cometer é proteção barata.

💥 Erro 1: Dois agentes na mesma branch

O que acontece

Dois agentes editam, fazem commit e push. O segundo recebe rejeição ou pior — sobrescreve trabalho.

Prevenção

1 agente = 1 worktree = 1 branch. Sempre. Sem exceção.

💥 Erro 2: Dois agentes no mesmo arquivo

O que acontece

Mesmo em worktrees diferentes, se ambos editam app/page.tsx, o merge vira pesadelo. Você perde 30 minutos resolvendo conflito.

Prevenção

Quebra a tarefa por área. Agente A em /billing, agente B em /dashboard. Sem overlap.

💥 Erro 3: Sandbox errado deleta coisa

O que acontece

Agente em full-access "limpa" arquivos achando que são lixo — apaga .env ou pasta de uploads do cliente.

Prevenção

Lista .env*, /uploads, /data em "Não Faça" do AGENTS.md. Use edit (não full) em código de cliente.

🛡️ Checklist anti-acidente multiagente

  • Cada agente tem worktree própria
  • Cada agente tem branch própria, nomeada por feature
  • Tarefas particionadas por área (sem overlap de arquivos)
  • Sandbox calibrado por blast radius do projeto
  • AGENTS.md tem seção "Não Faça" listando paths sensíveis
  • Pre-commit hook bloqueia .env* e *.key
  • Backup do main antes de mergear sessão multiagente

💡 A regra do "primeiro multiagente"

No seu primeiro projeto multiagente, faça 2 agentes em paralelo, não 4. Aprenda a coreografia. Quando 2 agentes funcionam fluidos, suba pra 4. Pular direto pra 4 multiplica os erros antes de você desenvolver intuição.

O que Aprendemos

Janela de contexto enche e degrada — reconheça os sinais (esquecimento, contradição, prolixidade) e abra sessão nova com handoff.
Memory persistente: salve preferências, não tarefas — auditoria mensal mantém o agente afiado.
Sandbox por blast radius — read-only para auditoria, edit para cliente, full só em pasta isolada própria.
Worktrees são a base do multiagente — 1 agente = 1 worktree = 1 branch, sempre.
Sub-agent: regra dos 5 minutos — tarefa > 5min e paralelizável → delega; senão, faz no agente principal.
Erros caros multiagente: mesma branch, mesmo arquivo, sandbox errado — checklist anti-acidente previne tudo.

Próxima Trilha:

Trilha 3 — Frontend Agentic. Componentes, design system, animações, browser embutido pra QA visual, deploy de landing em 1h. A linguagem dos agentes vira produto vendável.