🌐 Browser Use: Agente Controla Browser Real
Diferente do browser embutido (que renderiza uma página pra você ver), Browser Use dá ao agente controle programático completo de um Chromium: ele navega, clica, preenche formulários, executa JavaScript, mantém sessão.
Browser embutido
Renderiza site dentro do Codex App pra VOCÊ ver e anotar. Útil pra desenvolvimento e debug visual.
Browser Use
Browser sob controle do AGENTE. Ele dirige sozinho, executa fluxos completos, extrai dados, testa apps.
🛠️ O que Browser Use sabe fazer
🖱️ Computer Use: Agente Controla seu Desktop
Computer Use é um degrau acima: o agente vê a tela inteira, move o mouse, digita teclas. Ele consegue abrir Photoshop, Figma, Excel, Notion desktop — qualquer app instalado, mesmo que não tenha API.
🎬 Como funciona o loop Computer Use
⚠️ Riscos reais
Computer Use opera no SEU usuário. Se você roda na sua máquina principal:
- • Acesso a TODAS suas senhas salvas no browser pessoal
- • Acesso a sessões logadas (Gmail, banco, AWS)
- • Pode mover/deletar arquivos por engano
- • Pode executar comandos no terminal aberto
Solução: rode em VM dedicada, perfil de usuário separado, ou container.
🎯 Quando Cada Um Faz Sentido
Browser Use é mais previsível e seguro. Computer Use é mais poderoso mas frágil. Default em Browser Use; só sobe pra Computer Use quando você não tem alternativa.
| Tarefa | Browser Use | Computer Use |
|---|---|---|
| Pesquisar 5 concorrentes (web) | ✓ ideal | overkill |
| Testar fluxo de checkout E2E | ✓ ideal | desnecessário |
| Login num SaaS B2B sem API | ✓ ideal | overkill |
| Editar imagem no Photoshop desktop | ✗ impossível | ✓ único caminho |
| Fluxo entre Figma desktop e Slack | ✗ impossível | ✓ único caminho |
| Operar planilha Excel local | ✗ impossível | ✓ único caminho |
| Scrap de site com login | ✓ ideal | overkill |
📌 Regra prática
Se o fluxo nasce e morre no browser → Browser Use. Se ele atravessa apps desktop → Computer Use. Nunca use Computer Use por preguiça de configurar Browser Use direito — fragilidade adicional não é grátis.
🔒 Configurando Permissões com Segurança
A diferença entre uso seguro e desastre é configurar isolamento na primeira vez. Allowlist de domínios, perfil de browser dedicado, sessão sem credentials de produção.
📝 Config de allowlist (browser-use.config.json)
{
"browserProfile": "agent-isolated",
"allowedDomains": [
"*.inboxai.app",
"stripe.com",
"github.com",
"*.stackoverflow.com"
],
"blockedPatterns": [
"*/banking/*",
"*/checkout-real/*",
"auth.google.com"
],
"session": {
"persistent": false,
"clearOnExit": true
},
"downloads": {
"directory": "~/agent-downloads",
"maxSizeMB": 50
}
}
✅ Checklist de setup seguro
🛠️ Casos de Uso Reais (que vendem)
Esses são fluxos que clientes pagam R$ 3-15k de setup mais R$ 500-2k/mês de manutenção. Não é exercício acadêmico — é commodity vendável agora.
Pesquisa de Concorrentes
Browser Use abre 5 sites de concorrente, extrai pricing, features, testimonials, blog. Gera tabela comparativa.
Testes E2E de Checkout
Browser Use roda diariamente o fluxo: produto → carrinho → pagamento sandbox → confirmação. Alerta se quebra.
Relatórios de SaaS sem API
Login no SaaS B2B (sem API pública), extrai métricas, gera PDF semanal, envia por e-mail.
📋 Briefing tipo: pesquisa de concorrente
# Tarefa pra agente Browser Use
Para cada concorrente em ./concorrentes.txt:
1. Acessar o site
2. Extrair: pricing, lista de features (Hero), tom da copy
3. Tirar screenshot da Hero e da página de pricing
4. Tentar achar /blog → contar quantos posts em 2025
5. Salvar em ./output/<dominio>/
Ao final, gerar ./output/comparativo.md com tabela
de pricing e features lado a lado.
Restrições:
- Não logar em nada
- Não preencher formulário (newsletter, contato)
- Não baixar arquivos > 5MB
- Pular se site exigir captcha
- Limite 3min por concorrente
⚠️ Limites e Riscos: Onde NÃO Ir
Conhecer os limites antes de prometer ao cliente evita projeto que entrega 80% e morre nos 20% finais — o pior cenário comercial possível.
🚫 NÃO USE para
- ✗Banking, fintech crítica — risco legal e técnico
- ✗Sites com captcha agressivo (LinkedIn, Cloudflare)
- ✗Conteúdo dinâmico WebSocket (chat live)
- ✗Dados de saúde (LGPD pesado)
- ✗Login com 2FA SMS (você precisa do celular)
- ✗Termos de uso explícitos contra automação
⚠️ Use com cuidado em
- !SaaS com rate limit agressivo (espere 2-5s entre ações)
- !Sites com SPA pesada (waitForSelector explícito)
- !Fluxos com upload grande (timeout)
- !Logins de cliente (avise sobre privacidade)
- !Dados PII (LGPD compliance)
- !Operações irreversíveis (delete, send)
💡 Mitigação prática
Para tudo que NÃO está na lista vermelha mas tem risco médio: rode primeiro em dry-run (sem clicar em botão de "salvar/enviar/deletar" — só registra o que faria). Aprovação humana antes do real. Isso mantém o agente útil sem virar bomba-relógio.
✅ O que Aprendemos
Próximo Módulo:
5.3 — Remotion: vídeo de lançamento em uma noite. React para vídeo, captura UI real do app, render 1080p e 9:16 prontos para todas as plataformas.