Módulo 5.1 — O que é o Intelecto

🏗️ Arquitetura do Intelecto

O Intelecto é uma ferramenta de design filosófico minimalista: ~3000 linhas de Python, 7 dependências pip, zero framework pesado. Você pode ler o código inteiro em uma tarde e entender cada decisão.

🏗️ Stack do Intelecto

~3000 linhas

Código legível, auditável em uma tarde. Sem mágica oculta em dependências pesadas.

7 dependências

python-telegram-bot, openai, tiktoken, sqlite-utils, python-dotenv, httpx + 1 opcional.

SQLite nativo

Banco de dados embutido no Python. Sem servidor, sem Docker, sem configuração de infra.

📄 SOUL.md, AGENTS.md e USER.md

O Intelecto define identidade através de três arquivos Markdown que são injetados como system prompt em cada conversa. Esta abordagem declarativa significa que você customiza o assistente editando texto — sem tocar no código Python.

📄 SOUL.md

# Alma do Assistente

Você é um assistente pessoal
focado em produtividade e
gestão de conhecimento.

## Valores
- Concisão acima de tudo
- Exemplos práticos sempre
- Sem jargão desnecessário

## Tom
- Direto e assertivo
- Curioso e proativo

Personalidade e valores permanentes

🤖 AGENTS.md

# Capacidades dos Agentes

## Agente de Memória
- Salva insights importantes
- Recupera contexto relevante
- Deduplica automaticamente

## Agente de Síntese
- Resume conversas longas
- Extrai pontos-chave
- Sugere próximos passos

Comportamentos e capacidades

👤 USER.md

# Contexto do Usuário

Nome: João
Área: Engenharia de Software

## Vault Obsidian
Domínios: Python, LLMs, Gestão
Páginas: ~150 notas wiki
Projetos ativos: 3

## Preferências
- Exemplos em Python
- Respostas curtas

Contexto pessoal e vault

💡 Dica: Integre o USER.md com o Vault

Adicione ao USER.md um resumo do seu vault Obsidian: domínios principais, projetos ativos e os 5 conceitos mais importantes do seu index.md. O Intelecto passará a sugerir páginas do wiki e a contextualizar respostas com o seu conhecimento compilado — sem nenhuma linha de código adicional.

🔍 Memória com BM25

O Intelecto usa SQLite FTS5 com algoritmo BM25 — a mesma tecnologia do Elasticsearch — para recuperar memórias relevantes. Sem embeddings, sem vetores, sem GPU. Apenas texto indexado e matemática de recuperação provada em décadas.

🔍 Fluxo de Memória BM25

📊 BM25 vs. Embeddings Vetoriais

BM25: Busca por palavras exatas com ponderação TF-IDF. Rápido, sem GPU, resultados previsíveis e depuráveis.
Embeddings: Busca semântica por similaridade de significado. Requer modelo de embedding, mais lento, resultados menos previsíveis.
Para o segundo cérebro: BM25 é superior para termos técnicos, nomes próprios e jargão de domínio — exatamente o que você armazena no vault.

⚡ Instalação e Configuração

O Intelecto está funcionando em menos de 10 minutos. Não há banco de dados para configurar, não há servidor para provisionar — apenas Python e um token do Telegram.

Clone e instale dependências

git clone https://github.com/inematds/intelecto
cd intelecto
pip install -r requirements.txt

7 pacotes: python-telegram-bot, openai, tiktoken, sqlite-utils, python-dotenv, httpx, anthropic

Configure o .env

TELEGRAM_TOKEN=seu_token_do_botfather
OPENROUTER_API_KEY=sk-or-...
MODEL=anthropic/claude-3-haiku
ALLOWED_USER_IDS=123456789

Crie o bot no @BotFather do Telegram e copie o token

Customize os arquivos de identidade

nano SOUL.md    # Personalidade do assistente
nano USER.md    # Seu contexto pessoal + vault
nano AGENTS.md  # Capacidades dos agentes

Esta é a principal forma de customização — sem tocar no Python

Execute e converse

python main.py
# Abra o Telegram, encontre seu bot
# Envie /start e comece a conversar

SQLite é criado automaticamente. Memórias começam a ser salvas na primeira conversa.

☁️ OpenRouter e Ollama

O Intelecto é agnóstico ao modelo: uma variável de ambiente no .env troca o backend sem alterar uma linha de código. Use modelos potentes na nuvem para tarefas complexas e modelos locais para operações repetitivas.

✓ OpenRouter — Quando Usar

✓Ingestão de fontes complexas (PDFs longos, artigos técnicos)
✓Compilação de páginas wiki com síntese de alta qualidade
✓Consultas que exigem raciocínio multi-hop no grafo
✓Auditoria do vault (identificar contradições e gaps)

✓ Ollama Local — Quando Usar

✓Sumarização automática de conversas (frequente, barato deve ser)
✓Deduplication de memórias (operação em lote)
✓Consultas simples e rápidas no dia a dia
✓Testes de prompts sem custo de API

Configuração do backend no .env

# OpenRouter (cloud)
MODEL=anthropic/claude-3-haiku          # barato, rápido
MODEL=anthropic/claude-sonnet-4-5       # para tarefas complexas
MODEL=google/gemini-flash-1.5           # alternativa econômica

# Ollama (local) — rode: ollama pull llama3.2
MODEL=ollama/llama3.2
MODEL=ollama/qwen2.5:7b
MODEL=ollama/mistral:7b

⚖️ Intelecto vs Alternativas

Existem dezenas de assistentes pessoais de IA. O Intelecto se distingue pela hackabilidade radical: você lê o código, entende cada decisão e modifica o que precisar. Isso é decisivo para a integração com o vault.

Critério	Intelecto	MemGPT	Custom RAG
Linhas de código	~3.000	~50.000+	Varia
Dependências	7	30+	15+
Interface	Telegram nativo	Web + API	Custom
Hackabilidade	Alta	Baixa	Alta
Integração com vault	Direta (bridge.py)	Complexa	Possível

⚠️ O que o Intelecto NÃO faz

O Intelecto não tem interface web, não tem suporte multi-usuário avançado out-of-the-box, não tem busca semântica por embeddings e não tem integração nativa com Notion/Confluence. Estas limitações são intencionais — manter o escopo pequeno é o que mantém o código hackável.

✅ Resumo do Módulo 5.1

✓

Arquitetura minimalista — ~3000 linhas Python, 7 deps, SQLite embutido, sem servidor

✓

Identidade declarativa — SOUL.md, AGENTS.md e USER.md definem o assistente via Markdown

✓

BM25 sem embeddings — SQLite FTS5 com ranking eficiente, sem GPU ou modelo de embedding

✓

Instalação em 10 min — clone, pip install, .env, execute. Memória automática desde a primeira mensagem

✓

Agnóstico ao modelo — OpenRouter (cloud) ou Ollama (local) via variável de ambiente

Próximo Módulo:

5.2 — Memória SQLite vs Wiki Markdown: como as duas memórias se complementam e quando usar cada uma.

← Voltar para Trilha 5 Próximo Módulo →