← Mapa do curso TRILHA 3

🦾 Avançado e Estratégico

Onde a engenharia encontra a estratégia. Cruze o reality gap com sim-to-real, domine a corrida dos humanoides, monte arquiteturas dual-system, mapeie o mercado de US$ 111B e leia a fronteira 2026-2030 da robótica generalista.

6
Módulos
36
Tópicos
~4h
Duração
Avançado
Nível
SIM REAL DOMAIN RANDOMIZATION Humanoides Híbridas Aplicações $111B 2030 →

Mapa da trilha

3.1~45 min

🌉 Sim-to-Real

Cruze o reality gap: randomize tudo, calibre o digital twin e transfira de verdade.

3.2~50 min

🤖 Humanoides

GR00T, Helix, Optimus, Unitree: a corrida pelo corpo de propósito geral.

3.3~45 min

🧠 Arquiteturas Híbridas

LLM que pensa devagar, VLA que age depressa: o dual-system na prática.

3.4~40 min

🏭 Aplicações

Manufatura, logística, saúde e agro: onde o ROI já fecha — e onde ainda não.

3.5~35 min

💰 Mercado e Oportunidades

US$ 111B até 2030: cadeia de valor, players, funding e onde estão as vagas.

3.6~45 min

🚀 Fronteira 2026-2030

Scaling laws, world models, self-improvement e certificação: o que vem aí.

Conteúdo detalhado

3.1

🌉 Sim-to-Real: Domain Randomization e Transfer

Treinar em milhões de episódios simulados e funcionar no robô físico.

O que é: a divergência sistemática entre o que o simulador modela e o que o mundo físico faz — atrito de contato, atraso de atuadores, ruído de câmera, deformáveis.

Por que importa: uma política que acerta 99% em sim pode despencar para 30% no hardware. Sem mapear as fontes do gap você otimiza para o lugar errado.

Conceitos-chave: reality gap, contact dynamics, sensor noise, actuation delay, fidelidade de física.

O que é: randomizar agressivamente os parâmetros do sim para que o real vire "só mais uma amostra" da distribuição de treino.

Por que importa: é a técnica mais barata e robusta para transfer zero-shot; foi o que levou robôs de sim a manipular no mundo real.

Conceitos-chave: visual DR, dynamics DR, automatic DR (ADR), currículo de dificuldade.

O que é: em vez de cobrir tudo com ruído, aproxima-se a distribuição de features de sim e real (GANs, adversarial, alinhamento de embeddings).

Por que importa: complementa DR quando o gap visual é grande demais para randomizar.

Conceitos-chave: domain adaptation, feature alignment, RCAN, real-in-the-loop.

O que é: medir o robô real para calibrar o simulador (massas, atritos, latências) e construir um gêmeo digital fiel.

Por que importa: reduz o gap na origem; em vez de cobrir incerteza, você a elimina onde dá.

Conceitos-chave: sysID, digital twin, calibração, Isaac Sim/MuJoCo tuning.

O que é: misturar dados sim baratos com poucas demonstrações reais caras; o sim dá cobertura, o real dá fidelidade final.

Por que importa: é a receita prática dominante — 95% sim + 5% real bate ambos isolados.

Conceitos-chave: co-training, fine-tuning, sample efficiency, real-world adaptation.

O que é: protocolos que medem desempenho no real sob variação, não no sim onde você treinou.

Por que importa: sim-score infla expectativa; só A/B real conta para deploy.

Conceitos-chave: real-world success rate, held-out, sim2real gap metric.

Ver Completo →
3.2

🤖 Humanoides: Figure, Tesla, Unitree, GR00T

A aposta no corpo de propósito geral para um mundo feito por humanos.

O que é: a tese de que a forma humana destrava o estoque mundial de ferramentas, escadas e ambientes sem reformá-los.

Por que importa: generalidade de forma + foundation models = um corpo, infinitas tarefas.

Conceitos-chave: generalidade de forma, brownfield deployment, dexterity.

O que é: modelo de fundação aberto para humanoides com sistema dual (raciocínio + ação) treinado com dados reais, sintéticos e neural-trajectories.

Por que importa: NVIDIA fornece o "cérebro + pipeline de dados (Isaac/Cosmos)" que vários OEMs adotam.

Conceitos-chave: GR00T N1/N1.5, dual-system, Isaac GR00T, dados sintéticos.

O que é: arquitetura da Figure com System 2 (VLM lento, ~7-9Hz) que raciocina e System 1 (política rápida, ~200Hz) que controla mãos hábeis.

Por que importa: resolve o conflito generalidade × frequência; pioneiro em controle de torso completo via VLA.

Conceitos-chave: Helix, System 1/2, latent vector, whole-upper-body.

O que é: humanoide da Tesla reusando visão end-to-end e compute do FSD, com foco em manufatura interna primeiro.

Por que importa: vantagem de escala de produção e de dados de teleoperação verticalmente integrados.

Conceitos-chave: Optimus Gen 2/3, FSD reuse, escala industrial, atuadores próprios.

O que é: humanoides chineses de baixo custo (G1 a partir de ~US$ 16k) que democratizaram a pesquisa em hardware real.

Por que importa: reduz a barreira de entrada; virou plataforma padrão de papers de locomoção/manipulação.

Conceitos-chave: Unitree G1/H1, custo, hardware acessível, SDK aberto.

O que é: coordenar marcha, equilíbrio e braços num só controlador; RL para locomoção robusta em terreno.

Por que importa: manipular caминhando é o que separa demo de utilidade real.

Conceitos-chave: whole-body control, RL de marcha, balance, loco-manipulation.

Ver Completo →
3.3

🧠 Arquiteturas Híbridas: LLM Planner + VLA Executor

Pensar devagar e agir depressa no mesmo robô.

O que é: separar planejamento de alto nível (lento, abstrato) do controle reativo (rápido, contínuo).

Por que importa: nenhuma rede única é boa em raciocínio longo e em malha de 200Hz ao mesmo tempo.

Conceitos-chave: hierarquia, planejamento simbólico, política reativa.

O que é: VLM lento "pensa" e emite um vetor latente; política rápida o consome para gerar ações de alta frequência.

Por que importa: é a arquitetura convergente dos humanoides de ponta em 2026.

Conceitos-chave: dual-system, latent conditioning, async inference.

O que é: usar um LLM para decompor uma instrução longa em subtarefas executáveis, opcionalmente como código.

Por que importa: destrava tarefas de horizonte longo sem treinar uma política monolítica gigante.

Conceitos-chave: SayCan, Code-as-Policies, task decomposition, prompting.

O que é: ligar a linguagem do planejador a habilidades que o robô realmente consegue executar no estado atual.

Por que importa: evita planos lindos mas impossíveis; o "can" do SayCan.

Conceitos-chave: affordance, grounding, value function, viabilidade.

O que é: fechar o loop — detectar falha, atualizar a memória e replanejar em vez de seguir cego.

Por que importa: robustez vem de recuperação, não de execução perfeita.

Conceitos-chave: closed-loop, inner monologue, replanning, memória.

O que é: encadear dezenas de skills por minutos mantendo coerência e robustez.

Por que importa: é o gargalo atual — tarefas longas ainda acumulam falha.

Conceitos-chave: long-horizon, skill composition, robustez, drift.

Ver Completo →
3.4

🏭 Aplicações: Manufatura, Logística, Saúde, Agro

Onde a robótica generalista já gera valor — e onde ainda não fecha.

O que é: montagem flexível, inspeção visual e cobots colaborativos com ROI medido em ciclos de retorno.

Por que importa: é o mercado mais maduro; VLA reduz o custo de reprogramar por SKU.

Conceitos-chave: cobot, payback, flexibilidade, inspeção.

O que é: separação e embalagem em armazém, o caso de uso mais comercializado de manipulação com IA.

Por que importa: alto volume, ambiente semiestruturado e ROI claro: o "killer app" atual.

Conceitos-chave: bin picking, Covariant RFM, Symbotic, Amazon, fulfillment.

O que é: cirurgia assistida, manipulação de tecidos e cuidado, com altíssima exigência de segurança.

Por que importa: margens altas, mas barreira regulatória e de confiabilidade enorme.

Conceitos-chave: cirurgia assistida, force control, regulação, assistência.

O que é: colher frutas delicadas, mapear plantas e operar em ambiente totalmente não estruturado.

Por que importa: escassez de mão de obra cria demanda; variabilidade natural é o desafio.

Conceitos-chave: colheita seletiva, fenotipagem, outdoor, variabilidade.

O que é: cozinhar, limpar e arrumar casa — o ambiente mais variável e menos tolerante a erro social.

Por que importa: maior mercado potencial, mas o último a fechar tecnicamente.

Conceitos-chave: open-world, doméstico, generalização, cauda longa.

O que é: segurança, custo total, confiabilidade e integração com sistemas legados.

Por que importa: a tecnologia raramente é o gargalo; integração e confiança são.

Conceitos-chave: TCO, MTBF, safety, integração, change management.

Ver Completo →
3.5

💰 Mercado e Oportunidades: $111B até 2030

Cadeia de valor, players, funding e onde estão as vagas.

O que é: projeções de mercado (Goldman ~US$ 38B em humanoides até 2035; estimativas amplas de US$ 111B+ para robótica com IA até 2030).

Por que importa: dimensiona a oportunidade e calibra o hype com fontes.

Conceitos-chave: TAM, CAGR, Goldman/BCG, projeção 2030/2035.

O que é: as camadas de valor — silício, atuação, foundation models, integradores e dados.

Por que importa: entender onde a margem se acumula define onde vale empreender/investir.

Conceitos-chave: value chain, layers, integradores, moat de dados.

O que é: o mapa de startups e seus valuations bilionários (Physical Intelligence, Figure, Skild AI, 1X, Covariant).

Por que importa: o capital sinaliza onde o mercado aposta a próxima onda.

Conceitos-chave: Physical Intelligence, Figure, Skild, 1X, valuation.

O que é: robot-as-a-service, licenciamento do modelo e monetização de dados de operação.

Por que importa: RaaS reduz CapEx do cliente e alinha receita ao valor entregue.

Conceitos-chave: RaaS, licenciamento, data flywheel, recorrência.

O que é: perfis em alta — pesquisa em VLA, MLOps de robótica, integração, engenharia de dados de teleoperação.

Por que importa: orienta sua trajetória de carreira no setor.

Conceitos-chave: robot MLOps, data engineering, integração, pesquisa.

O que é: os riscos que podem atrasar a curva — exagero de expectativa, gap técnico residual, regulação e timing.

Por que importa: ler riscos é tão estratégico quanto ler oportunidade.

Conceitos-chave: hype-cycle, trough of disillusionment, timing, regulação.

Ver Completo →
3.6

🚀 Fronteira 2026-2030: Scaling Laws, World Models, Certificação

O que ainda é incerto — e o que muda quando for resolvido.

O que é: a pergunta de US$ bilhões — desempenho escala previsivelmente com dados e compute como em LLMs?

Por que importa: se sim, a corrida vira coleta de dados; se não, a arquitetura ainda manda.

Conceitos-chave: scaling laws, data×compute, incerteza, embodiment.

O que é: modelos que aprendem a dinâmica do mundo para imaginar futuros, gerar dados e planejar (Genie, NVIDIA Cosmos).

Por que importa: simulação neural barata pode quebrar o gargalo de dados.

Conceitos-chave: world model, Genie, Cosmos, neural sim, planejamento.

O que é: robôs coletando os próprios dados via RL em escala e autonomia de coleta.

Por que importa: o flywheel que pode tornar a melhoria contínua e barata.

Conceitos-chave: self-improvement, RL em escala, autonomia, flywheel.

O que é: um cérebro, muitos corpos — frotas que aprendem juntas e compartilham melhorias.

Por que importa: cada robô melhora todos; vantagem composta de escala.

Conceitos-chave: fleet learning, cross-embodiment, transferência, OTA.

O que é: garantir robôs aprendidos de forma certificável — ISO de segurança, fail-safe, alinhamento físico.

Por que importa: sem certificação não há deploy em larga escala perto de humanos.

Conceitos-chave: ISO 10218/15066, fail-safe, garantias, alinhamento físico.

O que é: projeções de impacto da robótica generalista em trabalho, produtividade e estrutura econômica.

Por que importa: decisões de carreira e negócio dependem de qual cenário você acredita.

Conceitos-chave: cenários 2030, produtividade, deslocamento, transição.

Ver Completo →
← Trilha 2 — Ferramentas Voltar ao mapa do curso