📦 O que e Chunking?
Chunking e a tecnica de quebrar inputs longos em pedacos menores que cabem confortavelmente na janela de contexto do modelo. E essencial quando voce esta construindo aplicacoes RAG ou processando documentos extensos.
💡 Conceito Principal
Imagine um livro de 500 paginas. Em vez de jogar tudo para o modelo de uma vez, voce divide em capitulos, secoes ou paragrafos. Cada "chunk" e processado separadamente, e os resultados sao combinados no final.
- • Por tamanho: Chunks de 500-1000 tokens cada
- • Por semantica: Chunks por topico ou secao logica
- • Com overlap: Chunks que se sobrepoe para nao perder contexto
📊 Quando Usar Chunking
- RAG Apps: Documentos para Supabase, Pinecone, etc.
- Analise de Relatorios: PDFs corporativos extensos
- Chatbots: Base de conhecimento grande
- Pesquisa: Papers academicos longos
📝 Summarizacao Estrategica
Summarizacao e o processo de extrair os pontos-chave de cada chunk e alimentar esses resumos no prompt final. E como criar um "FAQ" do seu documento que o modelo pode consumir rapidamente.
🎯 O Pipeline de Summarizacao
💡 Dica Pratica
Crie arquivos de sumario para documentos que voce usa frequentemente. E como ter FAQs prontas para um chatbot - quando o modelo precisa da informacao, ela ja esta pre-processada e otimizada para consumo.
🔧 Tecnicas de Chunking
Existem diferentes estrategias de chunking, cada uma com suas vantagens. A escolha depende do tipo de documento e do objetivo da aplicacao.
| Tecnica | Descricao | Melhor Para |
|---|---|---|
| Fixed-size | Chunks de tamanho fixo (ex: 500 tokens) | Textos uniformes, logs |
| Semantic | Chunks por significado/topico | Artigos, documentos estruturados |
| Recursive | Divide em separadores hierarquicos | Codigo, markdown, documentos tecnicos |
| Sliding Window | Chunks com overlap para contexto | Narrativas, conversas longas |
✓ Overlap Recomendado
- ✓ 10-20% de overlap entre chunks
- ✓ Evita cortar ideias no meio
- ✓ Mantem contexto entre secoes
✗ Erros Comuns
- ✗ Chunks muito pequenos (perda de contexto)
- ✗ Chunks muito grandes (Lost in the Middle)
- ✗ Zero overlap (cortes abruptos)
📊 Exemplo Pratico: Relatorio de 50 Paginas
Vamos aplicar chunking e summarizacao em um cenario real: analisar um relatorio corporativo de 50 paginas para extrair insights especificos.
🚨 O que NAO fazer
Empresas adoram: configurar ChatGPT Teams, jogar 5 PDFs e dizer "vai". Enquanto isso pode funcionar ocasionalmente (especialmente com reasoning models), nao e consistente.
O resultado: respostas vagas, informacoes perdidas, e hallucinations frequentes.
✓ O Approach Correto
Para uma pergunta sobre vendas Q4, foque no capitulo de resultados financeiros
Nao envie as 50 paginas quando so 3 sao necessarias
Para documentos recorrentes, tenha FAQs prontas
Menos contexto = mais atencao = melhor resultado
🔄 Combined Summaries
A tecnica de combined summaries e crucial quando voce precisa processar multiplos documentos ou chunks e consolidar tudo em uma resposta coesa.
🎯 O Processo
Passo 1: Summarize cada chunk
Extraia 3-5 pontos principais de cada pedaco do documento
Passo 2: Combine os sumarios
Junte todos os sumarios em um documento consolidado
Passo 3: Re-summarize se necessario
Se ainda estiver muito longo, faca uma segunda passada de summarizacao
Passo 4: Use no prompt final
Alimente o sumario combinado junto com sua pergunta especifica
📊 Vantagens
- • Consistencia: Resultados previsiveis e reproduziveis
- • Escalabilidade: Funciona com qualquer tamanho de documento
- • Reutilizacao: Sumarios podem ser usados em multiplas perguntas
🔧 Exercicio Pratico
Hora de aplicar chunking e summarizacao na pratica. Este exercicio vai consolidar as tecnicas aprendidas.
📝 Desafio: Pipeline de Summarizacao
Cenario: Voce tem um manual de politicas da empresa com 30 paginas e precisa criar um chatbot que responda perguntas sobre ele.
Tarefa:
- Divida o documento em secoes logicas (por capitulo/topico)
- Crie um sumario de 3-5 bullet points para cada secao
- Combine os sumarios em um "master summary"
- Teste fazendo 3 perguntas diferentes usando apenas o sumario
Meta: Conseguir responder 90% das perguntas comuns usando apenas o sumario, sem precisar consultar o documento original.
💡 Template de Prompt
Atue como um analista de documentos.
Leia a secao abaixo e extraia:
1. O topico principal (1 frase)
2. 3-5 pontos-chave (bullet points)
3. Termos importantes mencionados
Secao: [COLAR SECAO AQUI]
📋 Resumo do Modulo
Proximo Modulo:
1.4 - Estruturacao de Prompts: headings, XML tags, e formatacao eficiente