TRILHA 4

🤖 Agentes, MCP e Skills

Agentes autonomos, orquestracao multiagente, skills, MCP e memoria.

7
Modulos
42
Topicos
~6h
Duracao
Avancado
Nivel
Conteudo Detalhado
4.1 ~45 min

🤖 Introducao: Agentes, MCP e Skills

Visao geral dos fundamentos de agentes de IA. Panorama dos 6 temas que serao aprofundados nos modulos seguintes.

O que e:

Programas autonomos que percebem o ambiente, tomam decisoes e executam acoes para atingir objetivos sem intervencao humana constante.

Por que aprender:

42% das empresas ja usam agentes em producao. Entender o que sao e o primeiro passo para construi-los.

Conceitos-chave:

Agente vs chatbot, autonomia, loop percepcao-acao, LLM como cerebro do agente.

O que e:

Sistemas com multiplos agentes especializados que colaboram, cada um com um papel definido, coordenados por um orquestrador.

Por que aprender:

Tarefas complexas exigem divisao de trabalho. Um agente sozinho tem limites de contexto e habilidade.

Conceitos-chave:

Orquestrador, router, agentes especializados, padroes fan-out/fan-in, pipeline.

O que e:

Funcoes externas que agentes podem invocar: APIs, buscas, calculos, acesso a banco de dados, execucao de codigo.

Por que aprender:

Sem tools, agentes so geram texto. Com tools, eles agem no mundo real.

Conceitos-chave:

Function calling, tool definitions, JSON Schema, structured outputs.

O que e:

Protocolo padrao da Anthropic para conectar LLMs a fontes de dados e ferramentas externas via arquitetura Host/Client/Server.

Por que aprender:

MCP e o USB-C dos agentes: um padrao universal que elimina integracoes ad-hoc.

Conceitos-chave:

Host, Client, Server, Resources, Tools, Prompts, stdio vs SSE transport.

O que e:

Mecanismos para agentes reterem informacao entre interacoes e transferirem contexto entre si de forma eficiente.

Por que aprender:

Sem memoria, cada interacao comeca do zero. Sem handoff, agentes nao colaboram.

Conceitos-chave:

Memoria curta vs longa, episodica vs semantica, context passing, compactacao.

O que e:

Exercicio pratico: desenhar um sistema com 2 agentes, 1 skill e 1 MCP server conectados.

Por que aprender:

Visao integrada antes de aprofundar cada tema. Conecta todos os conceitos da trilha.

Conceitos-chave:

Diagrama de sistema, fluxo de mensagens, definicao de roles, escolha de ferramentas.

Ver Completo
4.2 ~50 min

🤖 O que sao Agentes de IA

Automacao vs agentes inteligentes, o loop ReAct, tool use, planning e agentes em producao.

O que e:

Automacao segue regras fixas (if/then). Agentes tomam decisoes dinamicas baseadas em contexto e objetivos.

Por que aprender:

Confundir automacao com agentes leva a arquiteturas erradas. Saber quando usar cada abordagem e critico.

Conceitos-chave:

RPA vs agentes, determinismo vs adaptacao, espectro de autonomia, quando usar cada um.

O que e:

Padrao onde o agente alterna entre raciocinio (Reason) e acao (Act) em ciclos ate completar a tarefa.

Por que aprender:

ReAct e o padrao fundamental de 90% dos agentes em producao. Entender o loop e entender agentes.

Conceitos-chave:

Thought-Action-Observation, loop iterativo, condicao de parada, max iterations.

O que e:

Capacidade do agente de invocar funcoes externas: buscar dados, executar codigo, chamar APIs, ler arquivos.

Por que aprender:

Tool use transforma um chatbot em um agente. E a diferenca entre falar sobre fazer e realmente fazer.

Conceitos-chave:

Function calling, tool definitions, parametros tipados, retorno de resultados, error handling.

O que e:

Capacidade do agente de quebrar tarefas complexas em subtarefas menores e executaveis, criando um plano de acao.

Por que aprender:

Agentes sem planning falham em tarefas de mais de 3 passos. Decomposicao e o que separa agentes toy de agentes reais.

Conceitos-chave:

Task decomposition, plan-and-execute, re-planning, backtracking, dependencias entre subtarefas.

O que e:

Dados de adocao de agentes em empresas: customer support, code review, data analysis, DevOps automation.

Por que aprender:

Agentes nao sao teoria: 42% das empresas ja usam. Entender os use cases reais guia o que construir.

Conceitos-chave:

Top 5 use cases, ROI medio, limitacoes atuais, projecoes Gartner 2027.

O que e:

Construir um agente simples com loop ReAct, 2 tools e condicao de parada. Testar com 3 cenarios.

Por que aprender:

Primeiro contato pratico com agentes. O loop ReAct fica concreto quando voce implementa.

Conceitos-chave:

Implementacao ReAct, 2 tools basicas, 3 cenarios de teste, debug de loop infinito.

Ver Completo
4.3 ~55 min

🌐 Multiagentes e Orquestracao

Por que multiplos agentes, padroes de orquestracao, roles, comunicacao e frameworks.

O que e:

Limites de um agente unico: context window, especializacao, paralelismo. Dividir para conquistar.

Por que aprender:

Agente unico com 50 tools e confuso. Agentes especializados com 5 tools cada sao precisos.

Conceitos-chave:

Limites de contexto, especializacao, paralelismo, isolamento de falhas, escalabilidade.

O que e:

4 padroes: Pipeline (sequencial), Router (classificador), Fan-out/Fan-in (paralelo), Hierarchical (manager).

Por que aprender:

Escolher o padrao errado cria complexidade desnecessaria. Cada padrao resolve um tipo de problema.

Conceitos-chave:

Pipeline, Router, Fan-out/Fan-in, Hierarchical, quando usar cada padrao.

O que e:

Definir papeis claros para cada agente: quem executa, quem analisa, quem revisa, quem decide.

Por que aprender:

Agentes sem role definido geram conflito e redundancia. Roles claros = sistema previsivel.

Conceitos-chave:

Role definition, system prompts por agente, separation of concerns, chain of responsibility.

O que e:

Como agentes trocam informacoes: message passing, shared state, event bus, structured handoff.

Por que aprender:

Comunicacao mal feita e a principal causa de falha em sistemas multiagente.

Conceitos-chave:

Message passing, shared memory, event-driven, protocolos de handoff, serialization.

O que e:

Comparacao dos 3 principais frameworks de multiagentes: CrewAI (roles), LangGraph (grafos), Swarm (handoffs).

Por que aprender:

Nao reinvente a roda. Cada framework tem trade-offs: simplicidade vs controle vs flexibilidade.

Conceitos-chave:

CrewAI crews/agents/tasks, LangGraph nodes/edges/state, Swarm routines/handoffs, quando usar cada.

O que e:

Construir sistema com Router + 2 agentes especializados. Testar roteamento e comunicacao.

Por que aprender:

Multiagentes so faz sentido quando voce implementa. A complexidade real aparece no handoff.

Conceitos-chave:

Router implementation, 2 agentes especializados, protocolo de comunicacao, testes end-to-end.

Ver Completo
4.4~50 min

🔧 Skills e Tools

O que sao skills, JSON Schema, function calling, structured outputs e skills reutilizaveis.

O que e:

Capacidades modulares que um agente pode invocar: buscar dados, enviar email, consultar API, executar codigo.

Por que aprender:

Skills sao o que transformam um LLM em algo util. Sem skills, agentes so conversam.

Conceitos-chave:

Skill vs tool vs plugin, anatomia de uma skill, input/output contract, composicao.

O que e:

Como definir tools usando JSON Schema: nome, descricao, parametros tipados, required vs optional.

Por que aprender:

Todas as APIs de LLM (OpenAI, Anthropic, Google) usam JSON Schema para tool definitions. E o padrao universal.

Conceitos-chave:

JSON Schema types, properties, required, enum, nested objects, array items.

O que e:

O fluxo completo: LLM recebe tools > decide usar > retorna JSON com nome e args > app executa > retorna resultado.

Por que aprender:

Function calling e o mecanismo core de agentes. Entender o fluxo completo evita bugs sutis.

Conceitos-chave:

Tool choice (auto/required/none), parallel tool calls, multi-turn tool use, error propagation.

O que e:

Forcar o LLM a retornar JSON valido que segue um schema pre-definido. Garantia de formato, nao apenas sugestao.

Por que aprender:

Sem structured outputs, parsing de resposta e fragil. Com eles, integracao entre agentes e confiavel.

Conceitos-chave:

response_format, strict mode, Zod/Pydantic schemas, validacao server-side.

O que e:

Padroes para criar skills que funcionam em qualquer agente: interface padrao, versionamento, composicao, testes.

Por que aprender:

Skills reutilizaveis aceleram o desenvolvimento de novos agentes em 3-5x.

Conceitos-chave:

Interface padrao, input validation, error handling, logging, composicao de skills.

O que e:

Criar 3 skills com JSON Schema completo: 1 de leitura, 1 de escrita, 1 de integracao externa.

Por que aprender:

Skills concretas para o SaaS que voce esta construindo. Saida diretamente utilizavel.

Conceitos-chave:

3 skills tipadas, JSON Schema completo, testes unitarios, documentacao inline.

Ver Completo
4.5~55 min

🌐 MCP (Model Context Protocol)

O protocolo padrao para conectar LLMs a ferramentas. Arquitetura, capacidades e implementacao.

O que e:

Model Context Protocol: padrao aberto da Anthropic para conectar LLMs a dados e ferramentas. O USB-C dos agentes.

Por que aprender:

Antes do MCP, cada integracao era custom. MCP padroniza: escreva uma vez, funcione em qualquer host.

Conceitos-chave:

Problema N x M, padronizacao, analogia USB-C, adocao por OpenAI/Google/Microsoft.

O que e:

3 camadas: Host (app como Claude Desktop), Client (gerencia conexao), Server (expoe capacidades).

Por que aprender:

Entender a arquitetura e pre-requisito para criar e debugar MCP servers.

Conceitos-chave:

Host, Client, Server, transport (stdio/SSE), lifecycle, capability negotiation.

O que e:

Resources (dados/contexto), Tools (acoes executaveis), Prompts (templates reutilizaveis). As 3 primitivas do MCP.

Por que aprender:

Saber qual primitiva usar para cada caso evita over-engineering e subuso do protocolo.

Conceitos-chave:

Resources (URI-based), Tools (JSON Schema), Prompts (templates), quando usar cada um.

O que e:

Passo a passo: setup com @modelcontextprotocol/sdk, definir tools, handler de requests, testar com MCP Inspector.

Por que aprender:

Criar MCP servers e a skill mais valiosa do ecossistema de agentes em 2026.

Conceitos-chave:

SDK TypeScript/Python, StdioServerTransport, tool handler, MCP Inspector, debug.

O que e:

Ecossistema de MCP servers prontos: GitHub, Slack, Google Drive, PostgreSQL, filesystem, browser.

Por que aprender:

Nao reinvente a roda. Centenas de MCP servers open source ja resolvem integracoes comuns.

Conceitos-chave:

MCP server registry, servers oficiais vs community, configuracao em claude_desktop_config.json.

O que e:

Criar MCP server com 2 tools para o seu SaaS. Testar com Inspector e conectar ao Claude Desktop.

Por que aprender:

MCP server custom e o bridge entre seu produto e qualquer LLM. Skill diretamente monetizavel.

Conceitos-chave:

Setup projeto, 2 tools, testes com Inspector, deploy, configuracao no host.

Ver Completo
4.6~50 min

🧠 Memoria e Handoff entre Agentes

Tipos de memoria, implementacoes praticas, context passing, tenant isolation e compactacao.

O que e:

4 tipos: Curta (context window), Longa (persistida), Episodica (eventos), Semantica (fatos/conhecimento).

Por que aprender:

Cada tipo resolve um problema diferente. Usar o tipo errado desperdica tokens ou perde informacao critica.

Conceitos-chave:

Short-term vs long-term, episodic vs semantic, salience scoring, decay functions.

O que e:

Como implementar: SQLite para memoria estruturada, embeddings + vector DB para semantica, key-value para sessao.

Por que aprender:

Teoria de memoria sem implementacao nao serve. Cada backend tem trade-offs de performance e custo.

Conceitos-chave:

SQLite, pgvector, ChromaDB, Pinecone, RAG para memoria, caching strategies.

O que e:

Como transferir contexto de um agente para outro sem perder informacao critica nem estourar context window.

Por que aprender:

Handoff mal feito perde contexto. Handoff com contexto demais estoura tokens. O equilibrio e uma arte.

Conceitos-chave:

Structured handoff, summary injection, selective context, metadata vs full context.

O que e:

Garantir que memorias de um usuario nao vazem para outro. Particionamento por tenant_id em todos os niveis.

Por que aprender:

Vazamento de memoria entre tenants e um dos bugs mais graves em SaaS com IA. Prevencao e obrigatoria.

Conceitos-chave:

Tenant isolation, row-level security, namespace partitioning, audit trails.

O que e:

Tecnicas para reduzir contexto sem perder informacao: sumarizacao progressiva, sliding window, hierarchical memory.

Por que aprender:

Context windows tem limite. Conversas longas precisam de compactacao inteligente para continuar funcionando.

Conceitos-chave:

Progressive summarization, sliding window, hierarchical memory, when to compact, quality metrics.

O que e:

Implementar sistema com memoria curta (sessao) + memoria longa (SQLite) + handoff entre 2 agentes.

Por que aprender:

Memoria e o que faz agentes parecerem inteligentes. Sem memoria, cada interacao e uma tabula rasa.

Conceitos-chave:

Session store, SQLite persistence, handoff protocol, 3 cenarios de teste.

Ver Completo
4.7~60 min

🔗 Integrar Agentes (Exercicio Final)

Revisao completa e exercicio final: integrar agentes, skills, MCP e memoria em um sistema funcional.

O que e:

Visao integrada de tudo que foi aprendido: como agentes, skills, MCP e memoria se conectam em um sistema real.

Por que aprender:

Cada modulo ensinou uma peca. Agora e hora de ver o quebra-cabeca completo.

Conceitos-chave:

Diagrama de arquitetura, fluxo de dados, dependencias entre componentes, checklist de integracao.

O que e:

Mapear quais agentes seu SaaS precisa, qual o papel de cada um, quais tools cada um usa.

Por que aprender:

Definir agentes antes de codar evita refactoring. A arquitetura de agentes e a arquitetura do produto.

Conceitos-chave:

Agent inventory, role matrix, tool assignment, system prompt per agent.

O que e:

O componente que recebe requests e direciona para o agente certo. Classificacao por intencao, fallback, retry.

Por que aprender:

O router e o ponto de entrada do sistema. Router ruim = todos os agentes recebem input errado.

Conceitos-chave:

Intent classification, routing rules, fallback agent, confidence threshold, logging.

O que e:

Wiring: conectar skills criadas no 4.4 e MCP servers do 4.5 aos agentes definidos no 4.7.2.

Por que aprender:

Integracao e onde tudo quebra. Testar cada conexao individualmente antes de testar o sistema completo.

Conceitos-chave:

Tool registry, MCP client config, dependency injection, health checks, integration tests.

O que e:

End-to-end testing: request entra, router classifica, agente processa, tools executam, memoria persiste, resposta sai.

Por que aprender:

Testes unitarios nao pegam bugs de integracao. O fluxo completo revela problemas que pecas isoladas escondem.

Conceitos-chave:

E2E test scenarios, happy path, error paths, latency budget, observability.

O que e:

Demo funcional: sistema com router + 2 agentes + skills + MCP + memoria. 5 cenarios de teste documentados.

Por que aprender:

Entregavel final da Trilha 4. Prova que voce sabe integrar todos os componentes de um sistema de agentes.

Conceitos-chave:

Demo script, 5 test scenarios, arquitetura documentada, video walkthrough, next steps.

Ver Completo
← Trilha 3 Trilha 5 →