🏗️ Arquitetura do Intelecto
O Intelecto é uma ferramenta de design filosófico minimalista: ~3000 linhas de Python, 7 dependências pip, zero framework pesado. Você pode ler o código inteiro em uma tarde e entender cada decisão.
🏗️ Stack do Intelecto
Código legível, auditável em uma tarde. Sem mágica oculta em dependências pesadas.
python-telegram-bot, openai, tiktoken, sqlite-utils, python-dotenv, httpx + 1 opcional.
Banco de dados embutido no Python. Sem servidor, sem Docker, sem configuração de infra.
📄 SOUL.md, AGENTS.md e USER.md
O Intelecto define identidade através de três arquivos Markdown que são injetados como system prompt em cada conversa. Esta abordagem declarativa significa que você customiza o assistente editando texto — sem tocar no código Python.
# Alma do Assistente
Você é um assistente pessoal
focado em produtividade e
gestão de conhecimento.
## Valores
- Concisão acima de tudo
- Exemplos práticos sempre
- Sem jargão desnecessário
## Tom
- Direto e assertivo
- Curioso e proativo
Personalidade e valores permanentes
# Capacidades dos Agentes
## Agente de Memória
- Salva insights importantes
- Recupera contexto relevante
- Deduplica automaticamente
## Agente de Síntese
- Resume conversas longas
- Extrai pontos-chave
- Sugere próximos passos
Comportamentos e capacidades
# Contexto do Usuário
Nome: João
Área: Engenharia de Software
## Vault Obsidian
Domínios: Python, LLMs, Gestão
Páginas: ~150 notas wiki
Projetos ativos: 3
## Preferências
- Exemplos em Python
- Respostas curtas
Contexto pessoal e vault
💡 Dica: Integre o USER.md com o Vault
Adicione ao USER.md um resumo do seu vault Obsidian: domínios principais, projetos ativos e os 5 conceitos mais importantes do seu index.md. O Intelecto passará a sugerir páginas do wiki e a contextualizar respostas com o seu conhecimento compilado — sem nenhuma linha de código adicional.
🔍 Memória com BM25
O Intelecto usa SQLite FTS5 com algoritmo BM25 — a mesma tecnologia do Elasticsearch — para recuperar memórias relevantes. Sem embeddings, sem vetores, sem GPU. Apenas texto indexado e matemática de recuperação provada em décadas.
🔍 Fluxo de Memória BM25
📊 BM25 vs. Embeddings Vetoriais
- BM25: Busca por palavras exatas com ponderação TF-IDF. Rápido, sem GPU, resultados previsíveis e depuráveis.
- Embeddings: Busca semântica por similaridade de significado. Requer modelo de embedding, mais lento, resultados menos previsíveis.
- Para o segundo cérebro: BM25 é superior para termos técnicos, nomes próprios e jargão de domínio — exatamente o que você armazena no vault.
⚡ Instalação e Configuração
O Intelecto está funcionando em menos de 10 minutos. Não há banco de dados para configurar, não há servidor para provisionar — apenas Python e um token do Telegram.
Clone e instale dependências
git clone https://github.com/inematds/intelecto
cd intelecto
pip install -r requirements.txt
7 pacotes: python-telegram-bot, openai, tiktoken, sqlite-utils, python-dotenv, httpx, anthropic
Configure o .env
TELEGRAM_TOKEN=seu_token_do_botfather
OPENROUTER_API_KEY=sk-or-...
MODEL=anthropic/claude-3-haiku
ALLOWED_USER_IDS=123456789
Crie o bot no @BotFather do Telegram e copie o token
Customize os arquivos de identidade
nano SOUL.md # Personalidade do assistente
nano USER.md # Seu contexto pessoal + vault
nano AGENTS.md # Capacidades dos agentes
Esta é a principal forma de customização — sem tocar no Python
Execute e converse
python main.py
# Abra o Telegram, encontre seu bot
# Envie /start e comece a conversar
SQLite é criado automaticamente. Memórias começam a ser salvas na primeira conversa.
☁️ OpenRouter e Ollama
O Intelecto é agnóstico ao modelo: uma variável de ambiente no .env troca o backend sem alterar uma linha de código. Use modelos potentes na nuvem para tarefas complexas e modelos locais para operações repetitivas.
✓ OpenRouter — Quando Usar
- ✓Ingestão de fontes complexas (PDFs longos, artigos técnicos)
- ✓Compilação de páginas wiki com síntese de alta qualidade
- ✓Consultas que exigem raciocínio multi-hop no grafo
- ✓Auditoria do vault (identificar contradições e gaps)
✓ Ollama Local — Quando Usar
- ✓Sumarização automática de conversas (frequente, barato deve ser)
- ✓Deduplication de memórias (operação em lote)
- ✓Consultas simples e rápidas no dia a dia
- ✓Testes de prompts sem custo de API
# OpenRouter (cloud)
MODEL=anthropic/claude-3-haiku # barato, rápido
MODEL=anthropic/claude-sonnet-4-5 # para tarefas complexas
MODEL=google/gemini-flash-1.5 # alternativa econômica
# Ollama (local) — rode: ollama pull llama3.2
MODEL=ollama/llama3.2
MODEL=ollama/qwen2.5:7b
MODEL=ollama/mistral:7b
⚖️ Intelecto vs Alternativas
Existem dezenas de assistentes pessoais de IA. O Intelecto se distingue pela hackabilidade radical: você lê o código, entende cada decisão e modifica o que precisar. Isso é decisivo para a integração com o vault.
| Critério | Intelecto | MemGPT | Custom RAG |
|---|---|---|---|
| Linhas de código | ~3.000 | ~50.000+ | Varia |
| Dependências | 7 | 30+ | 15+ |
| Interface | Telegram nativo | Web + API | Custom |
| Hackabilidade | Alta | Baixa | Alta |
| Integração com vault | Direta (bridge.py) | Complexa | Possível |
⚠️ O que o Intelecto NÃO faz
O Intelecto não tem interface web, não tem suporte multi-usuário avançado out-of-the-box, não tem busca semântica por embeddings e não tem integração nativa com Notion/Confluence. Estas limitações são intencionais — manter o escopo pequeno é o que mantém o código hackável.
✅ Resumo do Módulo 5.1
Próximo Módulo:
5.2 — Memória SQLite vs Wiki Markdown: como as duas memórias se complementam e quando usar cada uma.