MÓDULO 5.2

🖥️ Browser Use + Computer Use

Quando o agente precisa de um browser real para automatizar SaaS sem API, ou do desktop inteiro pra editar mídia entre apps — e onde NUNCA deixar ele entrar.

6
Tópicos
60
Minutos
Pro
Nível
Ferr
Tipo
1

🌐 Browser Use: Agente Controla Browser Real

Diferente do browser embutido (que renderiza uma página pra você ver), Browser Use dá ao agente controle programático completo de um Chromium: ele navega, clica, preenche formulários, executa JavaScript, mantém sessão.

👁️

Browser embutido

Renderiza site dentro do Codex App pra VOCÊ ver e anotar. Útil pra desenvolvimento e debug visual.

🤖

Browser Use

Browser sob controle do AGENTE. Ele dirige sozinho, executa fluxos completos, extrai dados, testa apps.

🛠️ O que Browser Use sabe fazer

• Navegar para URL
• Preencher formulários
• Clicar em botões e links
• Esperar carregar (waitForSelector)
• Tirar screenshot
• Extrair texto/atributos
• Executar JS na página
• Lidar com cookies e sessão
• Upload de arquivo
• Multi-tab e iframes
2

🖱️ Computer Use: Agente Controla seu Desktop

Computer Use é um degrau acima: o agente vê a tela inteira, move o mouse, digita teclas. Ele consegue abrir Photoshop, Figma, Excel, Notion desktop — qualquer app instalado, mesmo que não tenha API.

🎬 Como funciona o loop Computer Use

Screenshot tela atual Vision decide ação Ação click/type/scroll repete até concluir tarefa

⚠️ Riscos reais

Computer Use opera no SEU usuário. Se você roda na sua máquina principal:

  • • Acesso a TODAS suas senhas salvas no browser pessoal
  • • Acesso a sessões logadas (Gmail, banco, AWS)
  • • Pode mover/deletar arquivos por engano
  • • Pode executar comandos no terminal aberto

Solução: rode em VM dedicada, perfil de usuário separado, ou container.

3

🎯 Quando Cada Um Faz Sentido

Browser Use é mais previsível e seguro. Computer Use é mais poderoso mas frágil. Default em Browser Use; só sobe pra Computer Use quando você não tem alternativa.

Tarefa Browser Use Computer Use
Pesquisar 5 concorrentes (web)✓ idealoverkill
Testar fluxo de checkout E2E✓ idealdesnecessário
Login num SaaS B2B sem API✓ idealoverkill
Editar imagem no Photoshop desktop✗ impossível✓ único caminho
Fluxo entre Figma desktop e Slack✗ impossível✓ único caminho
Operar planilha Excel local✗ impossível✓ único caminho
Scrap de site com login✓ idealoverkill

📌 Regra prática

Se o fluxo nasce e morre no browser → Browser Use. Se ele atravessa apps desktop → Computer Use. Nunca use Computer Use por preguiça de configurar Browser Use direito — fragilidade adicional não é grátis.

4

🔒 Configurando Permissões com Segurança

A diferença entre uso seguro e desastre é configurar isolamento na primeira vez. Allowlist de domínios, perfil de browser dedicado, sessão sem credentials de produção.

📝 Config de allowlist (browser-use.config.json)

{
  "browserProfile": "agent-isolated",
  "allowedDomains": [
    "*.inboxai.app",
    "stripe.com",
    "github.com",
    "*.stackoverflow.com"
  ],
  "blockedPatterns": [
    "*/banking/*",
    "*/checkout-real/*",
    "auth.google.com"
  ],
  "session": {
    "persistent": false,
    "clearOnExit": true
  },
  "downloads": {
    "directory": "~/agent-downloads",
    "maxSizeMB": 50
  }
}

✅ Checklist de setup seguro

Perfil de browser dedicado (não usar o pessoal)
Allowlist de domínios definida no AGENTS.md
Credenciais via vault, não hardcoded
Computer Use só em VM ou usuário separado
Banking, e-mail pessoal, AWS prod → blocked
Sessão limpa entre execuções (cookies clear)
Logs de tudo que o agente acessou — auditável
5

🛠️ Casos de Uso Reais (que vendem)

Esses são fluxos que clientes pagam R$ 3-15k de setup mais R$ 500-2k/mês de manutenção. Não é exercício acadêmico — é commodity vendável agora.

🔍

Pesquisa de Concorrentes

Browser Use abre 5 sites de concorrente, extrai pricing, features, testimonials, blog. Gera tabela comparativa.

R$ 1.5-3k por relatório
🛒

Testes E2E de Checkout

Browser Use roda diariamente o fluxo: produto → carrinho → pagamento sandbox → confirmação. Alerta se quebra.

R$ 800-2k/mês
📊

Relatórios de SaaS sem API

Login no SaaS B2B (sem API pública), extrai métricas, gera PDF semanal, envia por e-mail.

R$ 3-8k setup + R$ 500/mês

📋 Briefing tipo: pesquisa de concorrente

# Tarefa pra agente Browser Use
Para cada concorrente em ./concorrentes.txt:
1. Acessar o site
2. Extrair: pricing, lista de features (Hero), tom da copy
3. Tirar screenshot da Hero e da página de pricing
4. Tentar achar /blog → contar quantos posts em 2025
5. Salvar em ./output/<dominio>/

Ao final, gerar ./output/comparativo.md com tabela
de pricing e features lado a lado.

Restrições:
- Não logar em nada
- Não preencher formulário (newsletter, contato)
- Não baixar arquivos > 5MB
- Pular se site exigir captcha
- Limite 3min por concorrente
6

⚠️ Limites e Riscos: Onde NÃO Ir

Conhecer os limites antes de prometer ao cliente evita projeto que entrega 80% e morre nos 20% finais — o pior cenário comercial possível.

🚫 NÃO USE para

  • Banking, fintech crítica — risco legal e técnico
  • Sites com captcha agressivo (LinkedIn, Cloudflare)
  • Conteúdo dinâmico WebSocket (chat live)
  • Dados de saúde (LGPD pesado)
  • Login com 2FA SMS (você precisa do celular)
  • Termos de uso explícitos contra automação

⚠️ Use com cuidado em

  • !SaaS com rate limit agressivo (espere 2-5s entre ações)
  • !Sites com SPA pesada (waitForSelector explícito)
  • !Fluxos com upload grande (timeout)
  • !Logins de cliente (avise sobre privacidade)
  • !Dados PII (LGPD compliance)
  • !Operações irreversíveis (delete, send)

💡 Mitigação prática

Para tudo que NÃO está na lista vermelha mas tem risco médio: rode primeiro em dry-run (sem clicar em botão de "salvar/enviar/deletar" — só registra o que faria). Aprovação humana antes do real. Isso mantém o agente útil sem virar bomba-relógio.

O que Aprendemos

Browser Use ≠ browser embutido — agente dirige sozinho, não você ver.
Computer Use é desktop inteiro — poderoso, frágil, perigoso sem isolamento.
Default em Browser Use — só suba pra Computer Use quando precisa de app desktop.
Allowlist + perfil isolado — segurança não é opcional, é setup obrigatório.
Casos vendáveis: pesquisa, E2E, relatórios SaaS — receita recorrente real.
Banking, captcha pesado, 2FA → não use — limite o escopo antes de prometer.

Próximo Módulo:

5.3 — Remotion: vídeo de lançamento em uma noite. React para vídeo, captura UI real do app, render 1080p e 9:16 prontos para todas as plataformas.