TRILHA 5

🤝 Múltiplos Agentes em Paralelo

Virar uma equipe de uma pessoa só: arquitetura sem caos, agentes que controlam browser e desktop, vídeo de lançamento em uma noite e marketing inteiro entregue por um único agente.

4
Módulos
24
Tópicos
~4h
Duração
Pro
Nível
VOCÊ Diretor Front Back QA Mkt Pesq Arq 6 agentes em paralelo, 1 diretor

Módulos desta Trilha

Conteúdo Detalhado

5.1 ~60 min

🎼 Arquitetura Multiagente sem Caos

Como ter 6 agentes em paralelo sem conflito de merge, sem agente A desfazendo trabalho do B e sem virar gerente de IA frustrado.

O que é:

Dois agentes editando o mesmo arquivo na mesma branch geram conflitos de merge horríveis. Pior: agente A desfaz mudança que B fez 2 minutos antes, sem perceber.

Por que aprender:

Quem tenta paralelismo sem isolamento perde mais tempo limpando bagunça do que ganharia com a paralelização. É a armadilha que faz gente desistir de multiagente.

Conceitos-chave:

Race condition no filesystem, conflito de merge, work invalidation, falta de isolamento.

O que é:

Git worktree cria pastas paralelas para branches diferentes do mesmo repo. Cada agente abre sua worktree, sua branch, e nunca pisa no outro até a hora do PR.

Por que aprender:

É a base técnica de paralelismo seguro. Sem isso, multiagente é teoria; com isso, vira workflow real que escala para 6+ agentes.

Conceitos-chave:

git worktree add, branches paralelas, isolation por tarefa, merge no PR, cleanup de worktrees.

O que é:

Cada agente tem AGENTS.md próprio descrevendo papel, escopo, fronteiras e o que NÃO deve tocar. Especialização vence generalismo no multiagente.

Por que aprender:

Sem papéis claros, agentes se sobrepõem e brigam por arquivos. Com papéis, cada um sabe seu território e a colaboração flui naturalmente.

Conceitos-chave:

AGENTS.md por papel, fronteiras explícitas, anti-objetivos, especialização, RACI agentic.

O que é:

Seu papel real: definir interfaces (contratos entre agentes), mediar conflitos quando dois agentes querem o mesmo arquivo, e decidir prioridades.

Por que aprender:

Quem fica programando junto não consegue coordenar. Quem só coordena entrega 4–8x mais. A virada de mindset é literalmente "eu não escrevo, eu dirijo".

Conceitos-chave:

Interface contracts, mediação de conflito, priorização, throughput vs envolvimento, alta liderança.

O que é:

Cada agente abre PR quando termina. Você revisa, comenta pedindo ajustes, faz merge. PRs são a interface assíncrona oficial entre agentes e diretor.

Por que aprender:

PRs estruturam a colaboração: quem viu o quê, quando, com qual feedback. Sem PRs, multiagente vira chat caótico sem rastro.

Conceitos-chave:

PR-driven workflow, async review, comentários inline, @codex review, history audit.

O que é:

Tarefa < 30min: o overhead de coordenar 2 agentes vence o ganho. Bug isolado em 1 arquivo: 1 agente focado é melhor. Saber quando NÃO fazer é maturidade.

Por que aprender:

Multiagente é poderoso mas custa atenção. Aplicar pra tudo é otimizar pra ferramenta, não pro resultado. O bom diretor sabe escolher o tamanho da equipe.

Conceitos-chave:

Coordination overhead, ponto de equilíbrio, escolha de ferramenta, single-agent flow, cost-benefit.

5.2 ~60 min

🖥️ Browser Use + Computer Use

Quando o agente precisa controlar um browser real ou seu desktop inteiro: pesquisa de concorrentes, automação de SaaS, testes E2E. E onde NÃO usar.

O que é:

Browser Use dá ao agente controle completo de um Chromium real: navegar, clicar, preencher formulários, ler página renderizada com JavaScript executado.

Por que aprender:

Tarefas que dependem de sites com login, JavaScript pesado ou estado de sessão exigem browser real. O fetch HTTP simples não dá conta.

Conceitos-chave:

Headless Chromium, Playwright sob o capô, sessão persistente, DOM real, screenshot.

O que é:

Computer Use vai além do browser: o agente vê a tela inteira, move o mouse, digita teclas, abre Photoshop, Figma, Excel — qualquer app instalado.

Por que aprender:

Workflows que envolvem múltiplos apps desktop (editar mídia, copiar entre programas) só são automatizáveis assim. É o degrau final da automação.

Conceitos-chave:

Vision do desktop, mouse/keyboard control, OCR, multi-app workflow, agente como usuário.

O que é:

Browser Use: pesquisa web, testes E2E, automação de SaaS. Computer Use: tarefas multi-app, edição de mídia local, fluxos que saem do navegador.

Por que aprender:

Escolher errado custa estabilidade. Computer Use é mais frágil que Browser Use — usar só quando realmente precisa do desktop.

Conceitos-chave:

Decision matrix, fragilidade vs poder, web vs desktop, escolha consciente.

O que é:

Allowlist de domínios, perfis de browser isolados, sessão sem cookies sensíveis. Computer Use idealmente roda em VM ou usuário separado.

Por que aprender:

Agente com acesso total ao seu desktop é risco real. Configurar isolamento na primeira vez evita catástrofe (login bancário, e-mail pessoal).

Conceitos-chave:

Allowlist, sandbox VM, perfil dedicado, secrets fora do alcance, principle of least privilege.

O que é:

Pesquisar 5 concorrentes e tabelar features. Testar fluxo de checkout em homologação. Automatizar relatório mensal que requer login num SaaS B2B sem API.

Por que aprender:

São workflows que valem dinheiro real para clientes. Saber executar bem é diferencial competitivo direto, não exercício acadêmico.

Conceitos-chave:

Competitor research, E2E testing, SaaS scraping, RPA agentic, monetização direta.

O que é:

Sites com captcha quebram. Rate limit derruba sessão. Conteúdo dinâmico via WebSocket é instável. Banking e financeiro: NÃO use, risco demais.

Por que aprender:

Conhecer os limites antes de prometer ao cliente evita projeto que entrega 80% e morre nos 20% finais — o pior cenário comercial.

Conceitos-chave:

Captcha walls, rate limiting, retry com backoff, lista de NÃO-USE, escopo realista.

5.3 ~60 min

🎬 Remotion: Vídeo de Lançamento em Uma Noite

React para vídeo. Você descreve o que quer mostrar, o agente monta composições, captura prints do app real e renderiza 1080p e 9:16 prontos para postar.

O que é:

Biblioteca que renderiza vídeo a partir de componentes React. Você programa o vídeo como programa um site: props, state, animações, frames.

Por que aprender:

Vídeo deixa de ser "abrir After Effects e clicar 200 vezes" e vira "código que agente edita". Isso muda quem consegue fazer vídeo profissional.

Conceitos-chave:

React-as-video, fps, duration in frames, composições, programmatic motion graphics.

O que é:

A skill Remotion do Codex automatiza setup, scaffolding de composições e render. Em 5 minutos você tem o primeiro vídeo .mp4 saindo do projeto.

Por que aprender:

Pular o setup manual mantém o foco no que importa: contar a história do produto. Skill faz heavy lifting; você dirige criação.

Conceitos-chave:

npx create-video, Composition root, render --output, skill agentic, scaffold pronto.

O que é:

Composition é a "cena". Sequence agrupa o que aparece em determinado intervalo. interpolate e spring criam animações fluidas a partir do frame atual.

Por que aprender:

Entender a anatomia destrava intervir no que o agente gera. Vai além do "rodou bonito" e te dá controle real sobre o resultado.

Conceitos-chave:

Composition, Sequence, useCurrentFrame, interpolate, spring, AbsoluteFill.

O que é:

Workflow: Browser Use abre o InboxAI rodando local, captura prints de telas-chave, agente importa no Remotion como assets e anima entre eles.

Por que aprender:

Vídeo com mock genérico parece pitch de aluno. Vídeo com a UI real do produto parece lançamento sério. Diferença vende.

Conceitos-chave:

Screenshot programático, asset pipeline, transição entre telas, mockup vs real.

O que é:

Mesmo projeto Remotion exporta 1920x1080 horizontal pra YouTube/Twitter e 1080x1920 vertical pra Reels/TikTok. Composição responsiva.

Por que aprender:

Reaproveitar o mesmo código pra todos os formatos é o que torna economicamente viável fazer vídeo pra cada plataforma. Sem isso, é trabalho 4x.

Conceitos-chave:

npx remotion render, multi-aspect ratio, composição responsiva, export queue.

O que é:

Cada plataforma exige duração ideal, legendas, thumbnail. Agente gera thumbnail com Image Gen, escreve título/legenda otimizada por canal.

Por que aprender:

Vídeo bom mal publicado não roda. Otimização por plataforma multiplica alcance sem custo extra de produção.

Conceitos-chave:

Hook nos 3s iniciais, thumbnail CTR, legenda nativa, hashtag por canal, schedule.

5.4 ~60 min

📣 Agente de Marketing: Landing + Copy + Posts

Um único agente entrega landing page de alta conversão, copy nos frameworks certos e calendário de 30 dias de posts. Você só publica.

O que é:

Template de briefing: o que o produto faz, pra quem, qual o problema-âncora, qual a oferta, qual o tom de voz, quais palavras evitar.

Por que aprender:

Briefing ruim gera marketing genérico. Briefing bom destrava agente que entrega copy que de fato converte. 80% do resultado vem do input.

Conceitos-chave:

Brief template, ICP, problema-âncora, oferta, voz da marca, anti-palavras.

O que é:

Anatomia padrão: Hero com hook, problema do leitor, solução do produto, prova social (logos/testemunhos), oferta, FAQ, CTA final.

Por que aprender:

Conhecer a estrutura permite revisar o que o agente entrega — não aceitar landing fora do padrão e identificar onde está furando.

Conceitos-chave:

Above the fold, Hero, social proof, oferta única, FAQ, double CTA, F-pattern.

O que é:

PAS: começa identificando o problema do leitor, agita mostrando consequências de não resolver, apresenta a solução. Funciona na maioria dos contextos.

Por que aprender:

Frameworks de copy não são opcionais. Texto sem estrutura emocional não converte. PAS dá o esqueleto que o agente preenche bem.

Conceitos-chave:

PAS, AIDA, BAB, framework-driven copy, consciência do problema, emoção antes da razão.

O que é:

Os 10 arquétipos: problema, solução, demo, depoimento, oferta, comparação, métrica, prova social, dica útil, CTA direto. Cada um cumpre função distinta.

Por que aprender:

Sem variedade, audiência cansa em 3 dias. Calendário com 10 formatos rotativos mantém engajamento por 30 dias sem repetir vibe.

Conceitos-chave:

Content pillars, rotação de formato, fadiga de conteúdo, calendário editorial, mix.

O que é:

Cada post sai com imagem original gerada por Image Gen 2 sob prompt cuidadoso. Sem aquela vibe genérica de banco de imagens.

Por que aprender:

Imagem original cria identidade visual reconhecível. Stock genérico vira ruído entre milhões de posts iguais. É grátis se diferenciar.

Conceitos-chave:

Prompt template, identidade visual consistente, paleta-marca, anti-stock, brand recognition.

O que é:

Workflow final: agente recebe briefing, gera landing, copy, 30 posts com imagens e schedule. Você revisa, agenda no Buffer e segue a vida.

Por que aprender:

É a aplicação prática que mostra o ROI: 1 noite de trabalho = pacote de marketing que antes custava R$ 8–15k de agência.

Conceitos-chave:

Pacote completo, ROI absurdo, agendamento, Buffer/Hootsuite, ship and forget.