Módulos desta Trilha
Conteúdo Detalhado
🎼 Arquitetura Multiagente sem Caos
Como ter 6 agentes em paralelo sem conflito de merge, sem agente A desfazendo trabalho do B e sem virar gerente de IA frustrado.
Dois agentes editando o mesmo arquivo na mesma branch geram conflitos de merge horríveis. Pior: agente A desfaz mudança que B fez 2 minutos antes, sem perceber.
Quem tenta paralelismo sem isolamento perde mais tempo limpando bagunça do que ganharia com a paralelização. É a armadilha que faz gente desistir de multiagente.
Race condition no filesystem, conflito de merge, work invalidation, falta de isolamento.
Git worktree cria pastas paralelas para branches diferentes do mesmo repo. Cada agente abre sua worktree, sua branch, e nunca pisa no outro até a hora do PR.
É a base técnica de paralelismo seguro. Sem isso, multiagente é teoria; com isso, vira workflow real que escala para 6+ agentes.
git worktree add, branches paralelas, isolation por tarefa, merge no PR, cleanup de worktrees.
Cada agente tem AGENTS.md próprio descrevendo papel, escopo, fronteiras e o que NÃO deve tocar. Especialização vence generalismo no multiagente.
Sem papéis claros, agentes se sobrepõem e brigam por arquivos. Com papéis, cada um sabe seu território e a colaboração flui naturalmente.
AGENTS.md por papel, fronteiras explícitas, anti-objetivos, especialização, RACI agentic.
Seu papel real: definir interfaces (contratos entre agentes), mediar conflitos quando dois agentes querem o mesmo arquivo, e decidir prioridades.
Quem fica programando junto não consegue coordenar. Quem só coordena entrega 4–8x mais. A virada de mindset é literalmente "eu não escrevo, eu dirijo".
Interface contracts, mediação de conflito, priorização, throughput vs envolvimento, alta liderança.
Cada agente abre PR quando termina. Você revisa, comenta pedindo ajustes, faz merge. PRs são a interface assíncrona oficial entre agentes e diretor.
PRs estruturam a colaboração: quem viu o quê, quando, com qual feedback. Sem PRs, multiagente vira chat caótico sem rastro.
PR-driven workflow, async review, comentários inline, @codex review, history audit.
Tarefa < 30min: o overhead de coordenar 2 agentes vence o ganho. Bug isolado em 1 arquivo: 1 agente focado é melhor. Saber quando NÃO fazer é maturidade.
Multiagente é poderoso mas custa atenção. Aplicar pra tudo é otimizar pra ferramenta, não pro resultado. O bom diretor sabe escolher o tamanho da equipe.
Coordination overhead, ponto de equilíbrio, escolha de ferramenta, single-agent flow, cost-benefit.
🖥️ Browser Use + Computer Use
Quando o agente precisa controlar um browser real ou seu desktop inteiro: pesquisa de concorrentes, automação de SaaS, testes E2E. E onde NÃO usar.
Browser Use dá ao agente controle completo de um Chromium real: navegar, clicar, preencher formulários, ler página renderizada com JavaScript executado.
Tarefas que dependem de sites com login, JavaScript pesado ou estado de sessão exigem browser real. O fetch HTTP simples não dá conta.
Headless Chromium, Playwright sob o capô, sessão persistente, DOM real, screenshot.
Computer Use vai além do browser: o agente vê a tela inteira, move o mouse, digita teclas, abre Photoshop, Figma, Excel — qualquer app instalado.
Workflows que envolvem múltiplos apps desktop (editar mídia, copiar entre programas) só são automatizáveis assim. É o degrau final da automação.
Vision do desktop, mouse/keyboard control, OCR, multi-app workflow, agente como usuário.
Browser Use: pesquisa web, testes E2E, automação de SaaS. Computer Use: tarefas multi-app, edição de mídia local, fluxos que saem do navegador.
Escolher errado custa estabilidade. Computer Use é mais frágil que Browser Use — usar só quando realmente precisa do desktop.
Decision matrix, fragilidade vs poder, web vs desktop, escolha consciente.
Allowlist de domínios, perfis de browser isolados, sessão sem cookies sensíveis. Computer Use idealmente roda em VM ou usuário separado.
Agente com acesso total ao seu desktop é risco real. Configurar isolamento na primeira vez evita catástrofe (login bancário, e-mail pessoal).
Allowlist, sandbox VM, perfil dedicado, secrets fora do alcance, principle of least privilege.
Pesquisar 5 concorrentes e tabelar features. Testar fluxo de checkout em homologação. Automatizar relatório mensal que requer login num SaaS B2B sem API.
São workflows que valem dinheiro real para clientes. Saber executar bem é diferencial competitivo direto, não exercício acadêmico.
Competitor research, E2E testing, SaaS scraping, RPA agentic, monetização direta.
Sites com captcha quebram. Rate limit derruba sessão. Conteúdo dinâmico via WebSocket é instável. Banking e financeiro: NÃO use, risco demais.
Conhecer os limites antes de prometer ao cliente evita projeto que entrega 80% e morre nos 20% finais — o pior cenário comercial.
Captcha walls, rate limiting, retry com backoff, lista de NÃO-USE, escopo realista.
🎬 Remotion: Vídeo de Lançamento em Uma Noite
React para vídeo. Você descreve o que quer mostrar, o agente monta composições, captura prints do app real e renderiza 1080p e 9:16 prontos para postar.
Biblioteca que renderiza vídeo a partir de componentes React. Você programa o vídeo como programa um site: props, state, animações, frames.
Vídeo deixa de ser "abrir After Effects e clicar 200 vezes" e vira "código que agente edita". Isso muda quem consegue fazer vídeo profissional.
React-as-video, fps, duration in frames, composições, programmatic motion graphics.
A skill Remotion do Codex automatiza setup, scaffolding de composições e render. Em 5 minutos você tem o primeiro vídeo .mp4 saindo do projeto.
Pular o setup manual mantém o foco no que importa: contar a história do produto. Skill faz heavy lifting; você dirige criação.
npx create-video, Composition root, render --output, skill agentic, scaffold pronto.
Composition é a "cena". Sequence agrupa o que aparece em determinado intervalo. interpolate e spring criam animações fluidas a partir do frame atual.
Entender a anatomia destrava intervir no que o agente gera. Vai além do "rodou bonito" e te dá controle real sobre o resultado.
Composition, Sequence, useCurrentFrame, interpolate, spring, AbsoluteFill.
Workflow: Browser Use abre o InboxAI rodando local, captura prints de telas-chave, agente importa no Remotion como assets e anima entre eles.
Vídeo com mock genérico parece pitch de aluno. Vídeo com a UI real do produto parece lançamento sério. Diferença vende.
Screenshot programático, asset pipeline, transição entre telas, mockup vs real.
Mesmo projeto Remotion exporta 1920x1080 horizontal pra YouTube/Twitter e 1080x1920 vertical pra Reels/TikTok. Composição responsiva.
Reaproveitar o mesmo código pra todos os formatos é o que torna economicamente viável fazer vídeo pra cada plataforma. Sem isso, é trabalho 4x.
npx remotion render, multi-aspect ratio, composição responsiva, export queue.
Cada plataforma exige duração ideal, legendas, thumbnail. Agente gera thumbnail com Image Gen, escreve título/legenda otimizada por canal.
Vídeo bom mal publicado não roda. Otimização por plataforma multiplica alcance sem custo extra de produção.
Hook nos 3s iniciais, thumbnail CTR, legenda nativa, hashtag por canal, schedule.
📣 Agente de Marketing: Landing + Copy + Posts
Um único agente entrega landing page de alta conversão, copy nos frameworks certos e calendário de 30 dias de posts. Você só publica.
Template de briefing: o que o produto faz, pra quem, qual o problema-âncora, qual a oferta, qual o tom de voz, quais palavras evitar.
Briefing ruim gera marketing genérico. Briefing bom destrava agente que entrega copy que de fato converte. 80% do resultado vem do input.
Brief template, ICP, problema-âncora, oferta, voz da marca, anti-palavras.
Anatomia padrão: Hero com hook, problema do leitor, solução do produto, prova social (logos/testemunhos), oferta, FAQ, CTA final.
Conhecer a estrutura permite revisar o que o agente entrega — não aceitar landing fora do padrão e identificar onde está furando.
Above the fold, Hero, social proof, oferta única, FAQ, double CTA, F-pattern.
PAS: começa identificando o problema do leitor, agita mostrando consequências de não resolver, apresenta a solução. Funciona na maioria dos contextos.
Frameworks de copy não são opcionais. Texto sem estrutura emocional não converte. PAS dá o esqueleto que o agente preenche bem.
PAS, AIDA, BAB, framework-driven copy, consciência do problema, emoção antes da razão.
Os 10 arquétipos: problema, solução, demo, depoimento, oferta, comparação, métrica, prova social, dica útil, CTA direto. Cada um cumpre função distinta.
Sem variedade, audiência cansa em 3 dias. Calendário com 10 formatos rotativos mantém engajamento por 30 dias sem repetir vibe.
Content pillars, rotação de formato, fadiga de conteúdo, calendário editorial, mix.
Cada post sai com imagem original gerada por Image Gen 2 sob prompt cuidadoso. Sem aquela vibe genérica de banco de imagens.
Imagem original cria identidade visual reconhecível. Stock genérico vira ruído entre milhões de posts iguais. É grátis se diferenciar.
Prompt template, identidade visual consistente, paleta-marca, anti-stock, brand recognition.
Workflow final: agente recebe briefing, gera landing, copy, 30 posts com imagens e schedule. Você revisa, agenda no Buffer e segue a vida.
É a aplicação prática que mostra o ROI: 1 noite de trabalho = pacote de marketing que antes custava R$ 8–15k de agência.
Pacote completo, ROI absurdo, agendamento, Buffer/Hootsuite, ship and forget.