MÓDULO 5.1

🧬 O que é o Intelecto

Conheça o assistente pessoal de IA via Telegram: arquitetura Python minimalista, memória BM25 com SQLite FTS5, identidade declarativa em Markdown e suporte a modelos cloud e locais.

6
Tópicos
40
Minutos
Prático
Nível
Setup
Tipo
1

🏗️ Arquitetura do Intelecto

O Intelecto é uma ferramenta de design filosófico minimalista: ~3000 linhas de Python, 7 dependências pip, zero framework pesado. Você pode ler o código inteiro em uma tarde e entender cada decisão.

🏗️ Stack do Intelecto

📱 Telegram python-telegram-bot 🧬 Intelecto Core 🗄️ SQLite + FTS5 BM25 memory 📄 SOUL.md USER.md / AGENTS.md 🧠 Summarizer Auto conversation ♻️ Deduplicator Similar memory remove ⚡ LLM Caller OpenRouter / Ollama 7 pip deps • ~3000 linhas • sem framework ☁️ OpenRouter Claude, GPT-4, Gemini... 🖥️ Ollama Llama, Mistral, Qwen...
~3000 linhas

Código legível, auditável em uma tarde. Sem mágica oculta em dependências pesadas.

7 dependências

python-telegram-bot, openai, tiktoken, sqlite-utils, python-dotenv, httpx + 1 opcional.

SQLite nativo

Banco de dados embutido no Python. Sem servidor, sem Docker, sem configuração de infra.

2

📄 SOUL.md, AGENTS.md e USER.md

O Intelecto define identidade através de três arquivos Markdown que são injetados como system prompt em cada conversa. Esta abordagem declarativa significa que você customiza o assistente editando texto — sem tocar no código Python.

📄 SOUL.md
# Alma do Assistente

Você é um assistente pessoal
focado em produtividade e
gestão de conhecimento.

## Valores
- Concisão acima de tudo
- Exemplos práticos sempre
- Sem jargão desnecessário

## Tom
- Direto e assertivo
- Curioso e proativo

Personalidade e valores permanentes

🤖 AGENTS.md
# Capacidades dos Agentes

## Agente de Memória
- Salva insights importantes
- Recupera contexto relevante
- Deduplica automaticamente

## Agente de Síntese
- Resume conversas longas
- Extrai pontos-chave
- Sugere próximos passos

Comportamentos e capacidades

👤 USER.md
# Contexto do Usuário

Nome: João
Área: Engenharia de Software

## Vault Obsidian
Domínios: Python, LLMs, Gestão
Páginas: ~150 notas wiki
Projetos ativos: 3

## Preferências
- Exemplos em Python
- Respostas curtas

Contexto pessoal e vault

💡 Dica: Integre o USER.md com o Vault

Adicione ao USER.md um resumo do seu vault Obsidian: domínios principais, projetos ativos e os 5 conceitos mais importantes do seu index.md. O Intelecto passará a sugerir páginas do wiki e a contextualizar respostas com o seu conhecimento compilado — sem nenhuma linha de código adicional.

3

🔍 Memória com BM25

O Intelecto usa SQLite FTS5 com algoritmo BM25 — a mesma tecnologia do Elasticsearch — para recuperar memórias relevantes. Sem embeddings, sem vetores, sem GPU. Apenas texto indexado e matemática de recuperação provada em décadas.

🔍 Fluxo de Memória BM25

💬 Query "o que sei sobre Python async?" 🗄️ SQLite FTS5 SELECT * FROM memories WHERE memories MATCH ? ORDER BY bm25(memories) 📊 BM25 Rankings #1 score: -0.92 (melhor) #2 score: -0.71 #3 score: -0.54 Top-5 injetadas no prompt 🤖 LLM Response Contexto: [mem1, mem2, mem3] + query + system prompt → resposta contextualizada

📊 BM25 vs. Embeddings Vetoriais

  • BM25: Busca por palavras exatas com ponderação TF-IDF. Rápido, sem GPU, resultados previsíveis e depuráveis.
  • Embeddings: Busca semântica por similaridade de significado. Requer modelo de embedding, mais lento, resultados menos previsíveis.
  • Para o segundo cérebro: BM25 é superior para termos técnicos, nomes próprios e jargão de domínio — exatamente o que você armazena no vault.
4

⚡ Instalação e Configuração

O Intelecto está funcionando em menos de 10 minutos. Não há banco de dados para configurar, não há servidor para provisionar — apenas Python e um token do Telegram.

1

Clone e instale dependências

git clone https://github.com/inematds/intelecto
cd intelecto
pip install -r requirements.txt

7 pacotes: python-telegram-bot, openai, tiktoken, sqlite-utils, python-dotenv, httpx, anthropic

2

Configure o .env

TELEGRAM_TOKEN=seu_token_do_botfather
OPENROUTER_API_KEY=sk-or-...
MODEL=anthropic/claude-3-haiku
ALLOWED_USER_IDS=123456789

Crie o bot no @BotFather do Telegram e copie o token

3

Customize os arquivos de identidade

nano SOUL.md    # Personalidade do assistente
nano USER.md    # Seu contexto pessoal + vault
nano AGENTS.md  # Capacidades dos agentes

Esta é a principal forma de customização — sem tocar no Python

4

Execute e converse

python main.py
# Abra o Telegram, encontre seu bot
# Envie /start e comece a conversar

SQLite é criado automaticamente. Memórias começam a ser salvas na primeira conversa.

5

☁️ OpenRouter e Ollama

O Intelecto é agnóstico ao modelo: uma variável de ambiente no .env troca o backend sem alterar uma linha de código. Use modelos potentes na nuvem para tarefas complexas e modelos locais para operações repetitivas.

✓ OpenRouter — Quando Usar

  • Ingestão de fontes complexas (PDFs longos, artigos técnicos)
  • Compilação de páginas wiki com síntese de alta qualidade
  • Consultas que exigem raciocínio multi-hop no grafo
  • Auditoria do vault (identificar contradições e gaps)

✓ Ollama Local — Quando Usar

  • Sumarização automática de conversas (frequente, barato deve ser)
  • Deduplication de memórias (operação em lote)
  • Consultas simples e rápidas no dia a dia
  • Testes de prompts sem custo de API
Configuração do backend no .env
# OpenRouter (cloud)
MODEL=anthropic/claude-3-haiku          # barato, rápido
MODEL=anthropic/claude-sonnet-4-5       # para tarefas complexas
MODEL=google/gemini-flash-1.5           # alternativa econômica

# Ollama (local) — rode: ollama pull llama3.2
MODEL=ollama/llama3.2
MODEL=ollama/qwen2.5:7b
MODEL=ollama/mistral:7b
6

⚖️ Intelecto vs Alternativas

Existem dezenas de assistentes pessoais de IA. O Intelecto se distingue pela hackabilidade radical: você lê o código, entende cada decisão e modifica o que precisar. Isso é decisivo para a integração com o vault.

Critério Intelecto MemGPT Custom RAG
Linhas de código ~3.000 ~50.000+ Varia
Dependências 7 30+ 15+
Interface Telegram nativo Web + API Custom
Hackabilidade Alta Baixa Alta
Integração com vault Direta (bridge.py) Complexa Possível

⚠️ O que o Intelecto NÃO faz

O Intelecto não tem interface web, não tem suporte multi-usuário avançado out-of-the-box, não tem busca semântica por embeddings e não tem integração nativa com Notion/Confluence. Estas limitações são intencionais — manter o escopo pequeno é o que mantém o código hackável.

Resumo do Módulo 5.1

Arquitetura minimalista — ~3000 linhas Python, 7 deps, SQLite embutido, sem servidor
Identidade declarativa — SOUL.md, AGENTS.md e USER.md definem o assistente via Markdown
BM25 sem embeddings — SQLite FTS5 com ranking eficiente, sem GPU ou modelo de embedding
Instalação em 10 min — clone, pip install, .env, execute. Memória automática desde a primeira mensagem
Agnóstico ao modelo — OpenRouter (cloud) ou Ollama (local) via variável de ambiente

Próximo Módulo:

5.2 — Memória SQLite vs Wiki Markdown: como as duas memórias se complementam e quando usar cada uma.