Pular para o conteúdo principal

Criando a base de conhecimento

Resumo: A "base de conhecimento" é o conjunto de informações que o agente IA consulta antes de responder. Você sobe textos, FAQs, páginas do seu site ou arquivos, e o gateway transforma isso em algo que o agente pode pesquisar em tempo real.

Quando usar isso

Sempre antes de ativar o agente IA em produção. Sem base de conhecimento, o agente vai responder com informações genéricas (ou inventadas). Com ela, ele responde com fatos da sua empresa.

O que adicionar à base?

Pense em tudo que um cliente novo precisaria saber:

  • Horário de funcionamento (incluindo feriados)
  • Endereço completo (e como chegar)
  • Lista de serviços/produtos com descrição e preço
  • Como agendar (quais canais, horários de marcação)
  • Política de cancelamento e remarcação
  • Formas de pagamento aceitas
  • Convênios atendidos (clínicas)
  • Perfil dos profissionais (consultórios)
  • FAQ específico do seu setor
  • Diferenciais da empresa

💡 Dica: Foque em informações factuais e estáveis. Promoções e ofertas temporárias é melhor passar diretamente pelo prompt do agente (mais fácil de atualizar) do que pela base.

Três formas de adicionar conteúdo

1. URL (página da web)

Cole o link de uma página pública. O gateway baixa o conteúdo HTML, extrai o texto e indexa.

Use quando:

  • Você tem uma página de FAQ no seu site
  • Tem uma página "Sobre nós" / "Como funciona" útil
  • A página é pública e estável (não muda toda hora)

Limites:

  • Máximo 5 MB de texto extraído por URL
  • Páginas que exigem login não funcionam (gateway não consegue acessar)

2. Texto inline

Cole o conteúdo direto numa caixa de texto.

Use quando:

  • Você tem uma FAQ escrita em Word/Google Docs
  • Quer adicionar instruções específicas que não estão em nenhum lugar online
  • Precisa atualizar trechos rápido

Limites:

  • Mínimo 20 caracteres
  • Máximo 200.000 caracteres por documento (cerca de 50 páginas A4 de texto puro)

3. Arquivo (via S3)

Para clientes mais avançados que já têm arquivos hospedados em Amazon S3, é possível apontar para a S3 key direta. Em V1 do produto, PDF e DOCX ainda não são suportados nativamente — você precisa extrair o texto antes (copiar e colar como texto inline, por exemplo).

Passo a passo

  1. Acesse Canais → escolha o canal → Agente IA → Base de conhecimento.
  2. Clique em Adicionar documento.
  3. Escolha o tipo:
    • URL: cole o link e dê um título.
    • Texto: cole o conteúdo e dê um título.
    • Arquivo S3: informe a chave (avançado).
  4. Clique em Enviar.
  5. O status muda para PENDING → PROCESSING → READY. Geralmente leva de segundos a 1 minuto dependendo do tamanho.
  6. Repita para cada peça de conteúdo.

Como o agente "lê" a base

Bastidores (em linguagem simples):

  1. Quando você adiciona um documento, o gateway o quebra em pedaços pequenos (parágrafos ou seções de até 500 palavras).
  2. Cada pedaço vira um "vetor matemático" (embedding) que representa seu significado.
  3. Quando um cliente faz uma pergunta, o gateway transforma a pergunta em vetor também e procura os pedaços mais similares.
  4. Esses pedaços são passados para o modelo de IA junto com a pergunta para gerar a resposta.

ℹ️ Saiba mais: Essa técnica se chama RAG (Retrieval-Augmented Generation — "Geração Aumentada por Recuperação"). Permite que o agente use suas informações sem precisar "treinar um modelo do zero" (o que seria caro e demorado).

Boas práticas

  1. Estruture com títulos e listas. O agente busca semanticamente, mas conteúdo bem organizado funciona melhor.

    Ruim:

    A clínica fica aberta das 8 até 18 de segunda a sexta e aos sábados das 9 às 12 e fechamos no domingo.

    Bom:

    Horário de funcionamento:

    • Segunda a sexta: 8h às 18h
    • Sábado: 9h às 12h
    • Domingo: fechado
  2. Separe por tópicos. Em vez de um documento gigante, prefira vários documentos menores (FAQ, Serviços, Endereço, Pagamento). Isso facilita atualizar uma parte sem mexer no resto.

  3. Atualize quando algo mudar. Mudou o horário? Apague o doc antigo e suba o novo. O agente passa a usar imediatamente.

  4. Evite informações conflitantes. Se um documento diz "horário 8h-18h" e outro diz "9h-17h", o agente pode confundir. Tenha uma fonte da verdade por tópico.

  5. Use linguagem natural. Escreva como se estivesse explicando para um cliente, não como tabela seca de dados.

Gerenciando documentos

Na lista de documentos do agente, você pode:

  • Ver detalhes: tamanho, número de chunks, status.
  • Apagar: remove o documento e todos os trechos indexados (cascade).
  • Reprocessar (se falhou): solicita nova indexação.

Dúvidas comuns

Quantos documentos posso ter? Não tem limite explícito por documento individual, mas cada documento pode ter no máximo 1000 chunks (pedaços). Para a maioria dos casos, isso é mais que suficiente.

O agente respondeu errado, e a resposta correta está na base. O que aconteceu? Pode ser:

  1. O chunk relevante não foi retornado entre os top-K (default 4) — aumente o ragTopK para 6 ou 8.
  2. O conteúdo está difícil de encontrar (pouco estruturado) — reescreva mais claramente.
  3. O prompt do agente não está dizendo "responda só com base nas informações fornecidas" — ajuste o prompt (veja Personalizando respostas do agent).

Os clientes podem ver minha base de conhecimento? Não. Só o agente acessa. O cliente só vê as respostas geradas, não os documentos.

Quanto custa indexar? Cada documento gera embeddings (paga ao OpenAI). Custo é muito baixo — cerca de US$ 0,01 por 100 mil tokens (~75 mil palavras). Indexar uma FAQ típica custa centavos.

Posso reprocessar tudo de uma vez? Não. Cada documento é reprocessado individualmente. Se quiser refazer do zero, apague todos e suba de novo.

Artigos relacionados