Criando a base de conhecimento
Resumo: A "base de conhecimento" é o conjunto de informações que o agente IA consulta antes de responder. Você sobe textos, FAQs, páginas do seu site ou arquivos, e o gateway transforma isso em algo que o agente pode pesquisar em tempo real.
Quando usar isso
Sempre antes de ativar o agente IA em produção. Sem base de conhecimento, o agente vai responder com informações genéricas (ou inventadas). Com ela, ele responde com fatos da sua empresa.
O que adicionar à base?
Pense em tudo que um cliente novo precisaria saber:
- Horário de funcionamento (incluindo feriados)
- Endereço completo (e como chegar)
- Lista de serviços/produtos com descrição e preço
- Como agendar (quais canais, horários de marcação)
- Política de cancelamento e remarcação
- Formas de pagamento aceitas
- Convênios atendidos (clínicas)
- Perfil dos profissionais (consultórios)
- FAQ específico do seu setor
- Diferenciais da empresa
💡 Dica: Foque em informações factuais e estáveis. Promoções e ofertas temporárias é melhor passar diretamente pelo prompt do agente (mais fácil de atualizar) do que pela base.
Três formas de adicionar conteúdo
1. URL (página da web)
Cole o link de uma página pública. O gateway baixa o conteúdo HTML, extrai o texto e indexa.
Use quando:
- Você tem uma página de FAQ no seu site
- Tem uma página "Sobre nós" / "Como funciona" útil
- A página é pública e estável (não muda toda hora)
Limites:
- Máximo 5 MB de texto extraído por URL
- Páginas que exigem login não funcionam (gateway não consegue acessar)
2. Texto inline
Cole o conteúdo direto numa caixa de texto.
Use quando:
- Você tem uma FAQ escrita em Word/Google Docs
- Quer adicionar instruções específicas que não estão em nenhum lugar online
- Precisa atualizar trechos rápido
Limites:
- Mínimo 20 caracteres
- Máximo 200.000 caracteres por documento (cerca de 50 páginas A4 de texto puro)
3. Arquivo (via S3)
Para clientes mais avançados que já têm arquivos hospedados em Amazon S3, é possível apontar para a S3 key direta. Em V1 do produto, PDF e DOCX ainda não são suportados nativamente — você precisa extrair o texto antes (copiar e colar como texto inline, por exemplo).
Passo a passo
- Acesse Canais → escolha o canal → Agente IA → Base de conhecimento.
- Clique em Adicionar documento.
- Escolha o tipo:
- URL: cole o link e dê um título.
- Texto: cole o conteúdo e dê um título.
- Arquivo S3: informe a chave (avançado).
- Clique em Enviar.
- O status muda para PENDING → PROCESSING → READY. Geralmente leva de segundos a 1 minuto dependendo do tamanho.
- Repita para cada peça de conteúdo.
Como o agente "lê" a base
Bastidores (em linguagem simples):
- Quando você adiciona um documento, o gateway o quebra em pedaços pequenos (parágrafos ou seções de até 500 palavras).
- Cada pedaço vira um "vetor matemático" (embedding) que representa seu significado.
- Quando um cliente faz uma pergunta, o gateway transforma a pergunta em vetor também e procura os pedaços mais similares.
- Esses pedaços são passados para o modelo de IA junto com a pergunta para gerar a resposta.
ℹ️ Saiba mais: Essa técnica se chama RAG (Retrieval-Augmented Generation — "Geração Aumentada por Recuperação"). Permite que o agente use suas informações sem precisar "treinar um modelo do zero" (o que seria caro e demorado).
Boas práticas
-
Estruture com títulos e listas. O agente busca semanticamente, mas conteúdo bem organizado funciona melhor.
Ruim:
A clínica fica aberta das 8 até 18 de segunda a sexta e aos sábados das 9 às 12 e fechamos no domingo.
Bom:
Horário de funcionamento:
- Segunda a sexta: 8h às 18h
- Sábado: 9h às 12h
- Domingo: fechado
-
Separe por tópicos. Em vez de um documento gigante, prefira vários documentos menores (FAQ, Serviços, Endereço, Pagamento). Isso facilita atualizar uma parte sem mexer no resto.
-
Atualize quando algo mudar. Mudou o horário? Apague o doc antigo e suba o novo. O agente passa a usar imediatamente.
-
Evite informações conflitantes. Se um documento diz "horário 8h-18h" e outro diz "9h-17h", o agente pode confundir. Tenha uma fonte da verdade por tópico.
-
Use linguagem natural. Escreva como se estivesse explicando para um cliente, não como tabela seca de dados.
Gerenciando documentos
Na lista de documentos do agente, você pode:
- Ver detalhes: tamanho, número de chunks, status.
- Apagar: remove o documento e todos os trechos indexados (cascade).
- Reprocessar (se falhou): solicita nova indexação.
Dúvidas comuns
Quantos documentos posso ter? Não tem limite explícito por documento individual, mas cada documento pode ter no máximo 1000 chunks (pedaços). Para a maioria dos casos, isso é mais que suficiente.
O agente respondeu errado, e a resposta correta está na base. O que aconteceu? Pode ser:
- O chunk relevante não foi retornado entre os top-K (default 4) — aumente o
ragTopKpara 6 ou 8. - O conteúdo está difícil de encontrar (pouco estruturado) — reescreva mais claramente.
- O prompt do agente não está dizendo "responda só com base nas informações fornecidas" — ajuste o prompt (veja Personalizando respostas do agent).
Os clientes podem ver minha base de conhecimento? Não. Só o agente acessa. O cliente só vê as respostas geradas, não os documentos.
Quanto custa indexar? Cada documento gera embeddings (paga ao OpenAI). Custo é muito baixo — cerca de US$ 0,01 por 100 mil tokens (~75 mil palavras). Indexar uma FAQ típica custa centavos.
Posso reprocessar tudo de uma vez? Não. Cada documento é reprocessado individualmente. Se quiser refazer do zero, apague todos e suba de novo.