RAG multimodal

Converse com seus arquivos usando IA

Faça upload de PDF, Word, planilhas, imagens, vídeo ou áudio e pergunte em linguagem natural. O MegaRAG entende todos eles.

# clonar e instalar
git clone https://github.com/inematds/MegaRAG.git
cd MegaRAG && npm install

# subir em desenvolvimento
npm run dev  # http://localhost:3000
O que é

Um RAG que funciona com qualquer tipo de arquivo

A maioria dos sistemas RAG só lê texto. O MegaRAG processa também imagens, vídeo e áudio usando IA Vision e transcrição, indexa tudo no Supabase com pgvector e responde citando o trecho de origem.

🧠 Multimodal de verdade

PDF, Word, PowerPoint, Excel, imagens, vídeo e áudio — cada formato vira texto pesquisável: a IA lê páginas, descreve imagens, assiste vídeos e transcreve áudio.

🧠 Busca vetorial + grafo

Embeddings no pgvector com índice HNSW, mais entidades e relações extraídas dos documentos para responder perguntas complexas.

🧠 Chat com fontes

Interface de chat com sessões e 5 modos de busca, sempre apontando de onde veio a resposta.

Como funciona

O pipeline RAG, do upload à resposta

Documentos passam por extração e geração de embeddings; na pergunta, o sistema busca os trechos relevantes e o LLM redige a resposta com base neles.

Upload Extração (IA) Chunks + embeddings pgvector Pergunta Resposta com fontes
Pré-requisitos

O que você precisa antes de começar

Node.js e Git no seu computador, uma conta Supabase (grátis) para o banco vetorial e uma chave da API do Google AI (grátis) para os modelos.

Node.js + Git

Runtime JavaScript e controle de versão. Confira as versões instaladas.

# verificar
node --version
git --version

Conta Supabase

Crie um projeto grátis e habilite a extensão pgvector pelo SQL Editor.

# no SQL Editor do Supabase
CREATE EXTENSION IF NOT EXISTS vector;

Chave Google AI

Gere a chave no Google AI Studio para embeddings e geração.

# .env.local
GOOGLE_AI_API_KEY=sua_chave
Guia de uso · passo a passo

Configurando e rodando o MegaRAG

O setup completo cria o banco no Supabase, configura as variáveis e sobe a aplicação Next.js localmente.

1

Clonar e instalar dependências

Baixe o código e instale os pacotes.

git clone https://github.com/inematds/MegaRAG.git
cd MegaRAG
npm install
2

Criar o projeto no Supabase e o banco

No SQL Editor, habilite o pgvector e rode os comandos SQL do projeto (tabelas de documentos, chunks, entidades, relações, chat e cache, além das funções de busca). Crie também o bucket de armazenamento.

CREATE EXTENSION IF NOT EXISTS vector;  # + scripts SQL do repo
3

Configurar as variáveis de ambiente

Crie o arquivo .env.local com as credenciais do Supabase e a chave do Google AI.

NEXT_PUBLIC_SUPABASE_URL=https://xxx.supabase.co
NEXT_PUBLIC_SUPABASE_ANON_KEY=...
SUPABASE_SERVICE_ROLE_KEY=...
GOOGLE_AI_API_KEY=...
4

Subir a aplicação

Rode o servidor de desenvolvimento e abra no navegador.

npm run dev  # http://localhost:3000
5

Fazer upload e conversar

No /dashboard, suba seus arquivos e aguarde o processamento. No /dashboard/chat, escolha o modo de busca e pergunte.

# modos de query no chat:
# Mix (padrão) · Naive · Local · Global · Hybrid
Exemplos

O que dá pra fazer

Cada modo de query é melhor para um tipo de pergunta — abaixo, casos típicos de uso do MegaRAG.

🧠 Perguntar a um PDF longo

Suba um relatório em PDF e pergunte no modo Mix: a IA lê páginas, tabelas e imagens e responde citando o trecho.

🧠 "Quem é X?" (modo Local)

O modo Local busca entidades primeiro — ideal para perguntas diretas sobre pessoas, conceitos ou termos.

🧠 Relações (modo Global)

"Como X se relaciona com Y?" — o modo Global segue os relacionamentos extraídos dos documentos.

🧠 Conversar com vídeo e áudio

Suba uma gravação: o MegaRAG transcreve o áudio e analisa o vídeo ao longo do tempo, tornando tudo pesquisável.

Roadmap

Estado atual e evolução

A aplicação já roda local e em produção. As fases refletem o caminho documentado no repositório.

Hoje
RAG multimodal completoUpload de múltiplos formatos, busca vetorial + grafo, chat com 5 modos e explorador de dados.
Deploy
ProduçãoDeploy na Vercel (recomendado), Railway, Render ou self-hosted, com checklist de produção.
Futuro
Mais fontes e ajustesNovos tipos de documento, refinamento de busca e melhorias na qualidade das respostas.