Skip to content

Las bases de conocimiento son una parte importante de los sistemas de inteligencia artificial (IA), especialmente para aquellos agentes o chatbots (Bots) basados ​​en grandes modelos de lenguaje (LLM). Las bases de conocimiento existen para compensar las deficiencias de LLM en conocimientos de dominios específicos y para resolver el problema de las "alucinaciones" (es decir, fabricar hechos) que pueden ocurrir cuando generan información.

El principio de funcionamiento de la base de conocimientos es que cuando un bot impulsado por un LLM necesita responder la pregunta de un usuario, no solo dependerá de su modelo previamente entrenado, sino que también buscará información relevante en su base de conocimientos. Esta base de conocimientos contiene una gran cantidad de hechos e información comprobados.

La ventaja de una base de conocimientos es que permite a los bots proporcionar información más precisa y relevante. Cuando un usuario ingresa una pregunta o solicitud, el Bot puede buscar los datos en la base de conocimientos para encontrar la información más relevante, luego refinarla y resumirla y proporcionársela al usuario como respuesta.

A través de dicha base de conocimientos, los sistemas de IA pueden comprender y procesar mejor el conocimiento en campos específicos, brindando así servicios de mayor calidad. Esto no sólo mejora la experiencia del usuario, sino que también mejora la credibilidad y practicidad del sistema de IA.

Crear una base de conocimientos

Embedding Model: El modelo de procesamiento de vectorización de datos se utiliza para vectorizar datos y no se puede cambiar después de la creación. Diferentes modelos tendrán resultados diferentes después de vectorizar los datos.

Modelo de generación de preguntas y respuestas: Se utiliza para generar datos de pares de preguntas y respuestas cuando se selecciona AQ split para importar datos, pero este modelo no se usará cuando se seleccionen otros métodos de importación.

Subir documentos
  • Entrada manual: La entrada manual de pares de preguntas y respuestas es la información más precisa
  • Segmentación directa: Seleccione un archivo de texto y procéselo directamente en segmentos
  • División de control de calidad: Seleccione un archivo de texto y deje que la IA genere automáticamente pares de preguntas y respuestas.
  • Importación CSV: Importación por lotes de pares de preguntas y respuestas
Longitud del párrafo

La longitud de cada segmento de párrafo se puede ajustar según la situación real.

Separador personalizado

Le permite fragmentar según separadores personalizados. Generalmente se usa para datos procesados, utilizando delimitadores específicos para fragmentarlos con precisión.

Palabras guía divididas de control de calidad

En la función de división de control de calidad, la palabra guía es un parámetro clave que afecta directamente la cantidad y calidad de los pares de preguntas y respuestas generados por el modelo LLM. Por lo tanto, elija un idioma que sea lo más relevante posible para el contenido y podrá personalizar las palabras principales.

Gestión de permisos de la base de conocimientos

Los repositorios corporativos o públicos permiten el acceso y uso a usuarios autorizados. Sin embargo, cuando el permiso de uso de la base de conocimientos se establece en privado, esta configuración de función no es válida y solo los usuarios con permiso pueden usar o participar en el mantenimiento de los documentos de la base de conocimientos.

Permisos de acceso

Hay dos tipos de permisos para utilizar la base de conocimientos:

  • Público: Los miembros dentro de la empresa están autorizados a utilizarlo.
  • Privado: sólo disponible para ti
Límite en el número de bases de conocimiento

Solo puede crear hasta 6 bases de conocimiento personales, mientras que la cantidad de bases de conocimiento de la empresa depende de la cantidad de paquetes comprados.