Simple RAG

Configuracao Basica do RAG

A base fundacional para criar agentes conversacionais com acesso a seus documentos

Workflow Pronto

Baixe o workflow completo e importe diretamente no seu N8N. Inclui fluxo de ingestao e fluxo de consulta.

Download Workflow JSON
Simple RAG Workflow

Fluxo de Ingestao e Vetorizacao

Trigger de Upload

Aceita documentos via interface de upload do N8N ou webhook de front-ends customizados.

Processamento de Dados Binarios

Detecta o tipo MIME e extrai o texto bruto automaticamente de PDFs, DOCs, TXTs e outros formatos.

Divisao Recursiva de Texto

Quebra documentos em tamanhos de chunk otimizados para embedding (recursive text splitter).

Geracao de Embeddings OpenAI

Converte chunks em vetores usando o modelo text-embedding-small.

Armazenamento Pinecone

Faz upload dos chunks vetorizados para o indice designado com metadados.

Fluxo de Retrieval e Resposta

Trigger de Chat

Escuta consultas via chat nativo do N8N, webhook, WhatsApp ou Telegram.

Vetorizacao da Query

Converte a pergunta do usuario no mesmo formato de embedding usado na ingestao.

Busca Semantica

Consulta o Pinecone pelos chunks mais relevantes baseado em pontuacao de similaridade.

Resposta de IA com Contexto

Alimenta os chunks recuperados + query para GPT-4 com janela de memoria de 10 mensagens.

Entrega da Resposta

Retorna a resposta pelo mesmo canal de comunicacao original.

Caso de Uso

Transforme documentos estaticos em uma base de conhecimento inteligente e conversacional - consulte documentacao interna atraves de linguagem natural sem busca manual.

Proposta de Valor

Acesso Instantaneo ao Conhecimento

Obtenha respostas precisas em segundos versus horas de busca manual em arquivos.

Reducao da Carga de Suporte

Desvie perguntas repetitivas para IA, cortando custos de suporte em 40-60%.

Respostas Sempre Atualizadas

Auto-indexa documentos atualizados sem retreinar modelos.

Base Escalavel

Estende facilmente com ferramentas, inputs multi-modais ou raciocinio avancado.

Compradores Ideais

Equipes de Suporte ao Cliente

Autoatendimento 24/7 para docs de ajuda e FAQs extensos.

Servicos Profissionais

Referencia rapida para arquivos de casos, precedentes legais, documentos de clientes.

Organizacoes de Saude

Acesso compativel com HIPAA a protocolos, pesquisas, educacao de pacientes.

TI e RH Internos

Automatize perguntas de funcionarios sobre politicas, beneficios, onboarding.

Instituicoes Educacionais

Acesso instantaneo de alunos a materiais de curso, ementas, artigos de pesquisa.

Equipes de Produto SaaS

Assistentes IA in-app para documentacao de produto e referencias de API.

Configuracao Passo a Passo

1. Escolha o Metodo de Upload

Use o upload nativo do N8N para testes, ou configure webhooks para integracao com front-ends como Lovable ou Bolt.

2. Configure o Pinecone

Crie uma conta no Pinecone, obtenha sua API key, crie um indice com as dimensoes corretas para o modelo de embedding.

3. Configure o Embedding

Use o mesmo modelo de embedding tanto na ingestao quanto no retrieval. O text-embedding-small e uma boa opcao para comecar.

4. Ajuste a Memoria

Configure a janela de memoria do agente (padrao: 10 mensagens). Ajuste conforme necessidade do caso de uso.

Voltar para Trilha RAG Proximo: Reranking RAG