TRILHA 1

🧠 Fundamentos

Antes de instalar qualquer coisa: por que rodar IA localmente, o vocabulario que voce vai usar o curso inteiro (LLM, agente, "SO de IA"), o que e o Ollama, o que e janela de contexto — e os tres modos de operar entre privado e nuvem.

Leia da esquerda pra direita: o que ia para a nuvem passa a ficar na sua maquina, que alimenta memoria, agente e modelo — resultando em custo zero, offline e privado.

Modulos

Topicos

~3h

Duracao

Basico

Nivel

Progresso da trilha0%

0 de 36 topicos

Mapa da trilha

1.1~30 min

🌍 Por que local e o futuro

A nuvem foi o passado

1.2~30 min

🗣️ O vocabulario

LLM, agente, SO de IA

1.3~30 min

📦 O que e o Ollama

A chave dos modelos abertos

1.4~30 min

🪟 Contexto e parametros

Por que 64k importa

1.5~30 min

⚖️ O trade-off

Privacidade, performance, preco

1.6~30 min

🗄️ Os tres modos

Vault, Connected, Cloud

Conteudo detalhado

1.1~30 min

🌍 Por que IA local e o futuro

A direcao de viagem da industria: da nuvem para o local. Ownership, custo zero, offline e os casos onde isso muda o jogo.

0 de 6 · 0%

O que e:

A industria moveu tudo para a nuvem; agora o movimento e de volta para a maquina do usuario — o local.

Por que aprender:

Entender a "direcao de viagem" te coloca a frente: a habilidade de rodar local sera tao basica quanto usar um computador.

Conceitos-chave:

Nuvem→local, ownership, supercomputador pessoal (a analogia do Jensen Huang).

O que e:

Voce possui fisicamente o modelo e os dados; nada vai para OpenAI ou Anthropic.

Por que aprender:

Parar de "alugar inteligencia" muda o jogo de custo, privacidade e controle.

Conceitos-chave:

Posse, dados em casa, sem vigilancia, sem vendor lock-in.

O que e:

Depois de baixar o modelo, cada uso e gratuito — nao ha cobranca por token nem mensalidade.

Por que aprender:

Background agents podem rodar 24/7 sem te dar um susto na fatura.

Conceitos-chave:

CAPEX vs OPEX, $0/token, sem rate limit.

O que e:

Como o modelo roda na sua maquina, ele funciona sem rede — no aviao, off-grid, onde for.

Por que aprender:

Sua produtividade nao depende mais de conexao nem de um servico estar no ar.

Conceitos-chave:

Disponibilidade, resiliencia, independencia de rede.

O que e:

Dados de cliente, saude, IP proprietario e ambientes regulados (SOC 2, GDPR, ISO 27001).

Por que aprender:

Para muitas empresas, o local nao e luxo — e o unico jeito legal de usar IA com certos dados.

Conceitos-chave:

Compliance, soberania de dados, "cerebro privado" do time.

O que e:

Local nao e religiao: voce traz o melhor pro trabalho e troca quando deixa de ser o melhor.

Por que aprender:

Evita o erro de forcar local onde a nuvem entrega muito mais — e vice-versa.

Conceitos-chave:

Pragmatismo, "siga o que funciona", divisao por % de trabalho.

Ver Completo

1.2~30 min

🗣️ O vocabulario: LLM, agente e SO de IA

As palavras que voltam o curso inteiro, definidas do zero: LLM, agente, ferramentas, memoria, persona, skill e o que e um "sistema operacional de IA".

0 de 6 · 0%

O que e:

Um LLM e o modelo de IA do tipo que roda atras do ChatGPT — preve a proxima palavra a partir do texto.

Por que aprender:

E a peca que voce vai baixar e rodar; saber o que ele e desmistifica o resto.

Conceitos-chave:

Modelo, previsao de tokens, pesos.

O que e:

Um agente e um LLM que usa "ferramentas": buscar na web, rodar codigo, editar arquivos — sozinho.

Por que aprender:

O Hermes e um agente; entender ferramentas explica por que ele faz coisas, nao so responde.

Conceitos-chave:

Ferramentas (tools), acao, loop de raciocinio.

O que e:

Um lugar unico que reune memoria, skills, conexoes e agentes do seu mundo de IA.

Por que aprender:

E o que voce vai montar na Trilha 3 — o "SO Hermes" rodando local.

Conceitos-chave:

Orquestracao, um lar para tudo, configuravel.

O que e:

Memoria = o que ele lembra; persona = como ele age; skill = uma capacidade que voce pluga.

Por que aprender:

Sao os blocos que voce configura para o agente virar SEU agente.

Conceitos-chave:

Memoria persistente, comportamento, capacidades plugaveis.

O que e:

Integracoes que dao ao agente acesso a fontes — repositorios, arquivos, ferramentas.

Por que aprender:

Conexoes transformam o agente de "conversador" em "operador" do seu trabalho.

Conceitos-chave:

Integracoes, contexto externo, acoes no mundo real.

O que e:

Local = roda na sua maquina; nuvem = roda na infraestrutura de uma empresa.

Por que aprender:

E a distincao que organiza o curso inteiro e os tres modos do modulo 1.6.

Conceitos-chave:

Infra propria vs alugada, onde os dados ficam.

Ver Completo

1.3~30 min

📦 O que e o Ollama e os modelos abertos

O programa que destrava os modelos abertos (Qwen, DeepSeek, Gemma, Mistral) na sua maquina — baixar uma vez e rodar de graca pra sempre.

0 de 6 · 0%

O que e:

Um programa que baixa, gerencia e roda modelos de IA na sua maquina, com app e terminal.

Por que aprender:

E a base de tudo: sem ele, nao ha modelo local para o agente usar.

Conceitos-chave:

Runtime local, gerenciador de modelos, simples de usar.

O que e:

Modelos liberados publicamente que voce pode baixar e rodar sem pedir licenca a ninguem.

Por que aprender:

A competicao do open-source e o que torna o local viavel e cada vez melhor.

Conceitos-chave:

Open weights, familias de modelos, escolha por tarefa.

O que e:

O modelo fica no seu disco; depois do download, a internet so e necessaria para baixar outros.

Por que aprender:

Explica o "offline" e o "$0/token" na pratica.

Conceitos-chave:

Download unico, execucao local, cache no disco.

O que e:

Ele sobe um servico local que recebe seu texto e devolve a resposta do modelo.

Por que aprender:

E assim que o Agente Hermes vai "falar" com o modelo na Trilha 2.

Conceitos-chave:

Servidor local, endpoint, modelo carregado em memoria.

O que e:

O "30B" no nome quer dizer 30 bilhoes de parametros — o tamanho do modelo.

Por que aprender:

Mais parametros = mais capaz, porem mais pesado pra sua maquina.

Conceitos-chave:

Parametros, tamanho vs capacidade, custo de hardware.

O que e:

Com a nuvem voce usa a infra deles; com o Ollama, tudo roda e fica no seu computador.

Por que aprender:

Deixa claro o que voce ganha (privacidade/custo) e o que cede (potencia bruta).

Conceitos-chave:

Metered vs local, controle, trade-off.

Ver Completo

1.4~30 min

🪟 Janela de contexto e parametros

O que e janela de contexto, o que e um token, por que o Agente Hermes exige 64k — e como o tamanho do modelo conversa com a sua RAM.

0 de 6 · 0%

O que e:

Quanto texto o modelo consegue "segurar na cabeca" de uma vez ao responder.

Por que aprender:

E o que limita (ou libera) tarefas longas, como um agente com memoria.

Conceitos-chave:

Contexto, limite de entrada+saida, memoria de trabalho.

O que e:

A unidade que o modelo le/gera — um token e ~3/4 de uma palavra em ingles.

Por que aprender:

Janela de contexto e medida em tokens; 64k tokens ≈ 25-30 mil palavras.

Conceitos-chave:

Token, tokenizacao, tokens ≠ palavras.

O que e:

O Agente Hermes pede um modelo com pelo menos 64.000 tokens de contexto por causa da memoria e das ferramentas.

Por que aprender:

E por isso que voce baixa o Qwen 3 Coder 64k na Trilha 2, e nao qualquer modelo.

Conceitos-chave:

Requisito de contexto, memoria do agente, ferramentas ocupam contexto.

O que e:

Parametros = o tamanho do "cerebro"; contexto = quanto ele le de uma vez. Sao independentes.

Por que aprender:

Um modelo de 30B pode ter contexto pequeno; voce precisa olhar os dois numeros.

Conceitos-chave:

Tamanho ≠ contexto, ler a ficha do modelo.

O que e:

O modelo precisa caber na memoria com folga; grande demais deixa a maquina lenta.

Por que aprender:

Evita o erro de baixar um modelo que trava o seu computador.

Conceitos-chave:

RAM/VRAM, headroom, baixar→testar→apagar.

O que e:

Para conversas curtas, um modelo menor e mais rapido basta; o 64k e para o agente.

Por que aprender:

Voce pode ter mais de um modelo e usar o certo pra cada coisa.

Conceitos-chave:

Modelo rapido vs modelo do agente, multiplos modelos.

Ver Completo

1.5~30 min

⚖️ O trade-off: privacidade, performance e preco

A verdade honesta: o melhor modelo local esta ~1 ano atras da fronteira. O que voce troca, o que os benchmarks dizem e como dividir o seu trabalho.

0 de 6 · 0%

O que e:

Com local, o dado nunca sai da maquina — nenhuma empresa ve o que voce escreve.

Por que aprender:

E o lado mais forte do local e o motivo numero 1 de muitos casos de uso.

Conceitos-chave:

Confidencialidade, soberania de dados.

O que e:

O melhor modelo local hoje equivale ao melhor da fronteira de ~12 meses atras.

Por que aprender:

Calibra a expectativa: e muito bom, mas nao e o topo absoluto.

Conceitos-chave:

Defasagem de ~1 ano, ritmo do open-source.

O que e:

Depois do hardware que voce ja tem, o uso e gratuito — sem assinatura.

Por que aprender:

Muda a economia de rodar agentes o dia inteiro.

Conceitos-chave:

$0/token, sem mensalidade, custo so de energia/hardware.

O que e:

Numeros comparando modelos (ex.: ~88,6 do Opus 4.8 vs ~74 do Qwen que voce roda).

Por que aprender:

Te ajuda a ler comparacoes com olho critico, sem virar refem de benchmark.

Conceitos-chave:

Benchmark, leitura critica, "otimizar benchmark".

O que e:

A velocidade da resposta depende do seu computador; modelos grandes ficam lentos.

Por que aprender:

Voce escolhe entre rapidez e qualidade conforme o que precisa na hora.

Conceitos-chave:

Latencia, hardware, tamanho do modelo.

O que e:

Imagine 100% do seu trabalho: uma fatia pede privacidade total, outra pede qualidade maxima.

Por que aprender:

E o raciocinio que leva direto aos tres modos do modulo 1.6.

Conceitos-chave:

Particionar tarefas, melhor ferramenta por fatia.

Ver Completo

1.6~30 min

🗄️ Os tres modos: Vault, Connected e Cloud

Como operar entre o totalmente privado e a melhor qualidade: Vault (privado), Connected (performance) e Cloud (qualidade) — e quando usar cada um.

0 de 6 · 0%

O que e:

Modo cofre: o agente so usa o modelo local, nada sai da maquina.

Por que aprender:

E o modo de dados sensiveis e de quando voce esta offline.

Conceitos-chave:

Vault mode, isolamento, privacidade total.

O que e:

Modo conectado, que traz mais potencia quando voce precisa de um empurrao.

Por que aprender:

E o meio-termo entre privacidade total e qualidade maxima.

Conceitos-chave:

Performance mode, equilibrio.

O que e:

Modo nuvem, para quando a qualidade bruta importa mais que a privacidade.

Por que aprender:

Saber quando ligar a nuvem evita perder tempo com local em tarefas dificeis.

Conceitos-chave:

Cloud mode, qualidade > privacidade, web fresca.

O que e:

Dados de cliente, financas, notas de saude, codigo proprietario, ou simplesmente sem internet.

Por que aprender:

E a regra pratica que te diz em qual modo ficar.

Conceitos-chave:

Criterio de sensibilidade, regra de decisao.

O que e:

Voce pode pedir ao Hermes para mandar uma tarefa pro modelo privado e outra pra nuvem.

Por que aprender:

E o coracao do Projeto 6 da Trilha 3.

Conceitos-chave:

Roteamento dinamico, "manda pro privado".

O que e:

Como o local e gratuito, da pra deixar agentes trabalhando o dia todo sem custo por uso.

Por que aprender:

E uma das maiores vantagens praticas do Vault mode.

Conceitos-chave:

Agentes em segundo plano, custo zero, automacao.

Ver Completo

← Inicio Trilha 2: Mao na massa →