Skip to content

知识库是人工智能(AI)系统的重要组成部分,特别是对于那些基于大型语言模型(LLM)的智能体或聊天机器人(Bot)。知识库的存在是为了弥补LLM在特定领域知识方面的不足,以及解决它们在生成信息时可能出现的“幻觉”(即编造事实)问题。

知识库的工作原理是,当一个LLM驱动的Bot需要回答用户的问题时,它不仅会依赖于其预训练的模型,还会在它的知识库中搜索相关的信息。这个知识库包含了大量的、经过验证的事实和信息

知识库的优点在于,它允许Bot提供更准确、更相关的信息。当用户输入一个问题或请求时,Bot可以检索知识库中的数据,找到最相关的信息,然后将其提炼总结后,作为回答提供给用户。

通过这样的知识库,AI系统能够更好地理解和处理特定领域的知识,从而提供更高质量的服务。这不仅提高了用户体验,也增强了AI系统的可信度和实用性。

创建一个知识库

Embedding Model: 数据向量化处理模型用于将数据进行向量化处理,创建后不可更改。不同的模型对数据向量化后的结果会有所不同。

问答生成模型: 用于在导入数据选择AQ拆分时生成问答对数据,而在选择其他导入方式时则不会使用该模型。

上传文档
  • 手动输入: 手动输入问答对,是最精准的数据
  • 直接分段: 选择文本文件,直接将其按分段进行处理
  • QA 拆分: 选择文本文件,让AI自动生成问答对
  • CSV 导入: 批量导入问答对
段落长度

每个段落切片的长度,可以根据实际情况进行调整

自定义分隔符

允许你根据自定义的分隔符进行分块。通常用于已处理好的数据,使用特定的分隔符来精确分块。

QA 拆分引导词

在 QA 拆分功能中,引导词是一个关键参数,它直接影响着LLM模型生成问答对的数量和质量。因此,请尽可能选择与内容相关的语言,并可以自定义引导词。

知识库权限管理

公司或公共知识库允许经授权的用户访问和使用。然而,当知识库的使用权限设为私有时,这一功能设置无效,只有拥有权限的用户可以使用或参与维护知识库的文档。

使用权限

知识库的使用权限分为两种:

  • 公开:公司内部成员已获得授权,可以使用。
  • 私有:仅自己可用
知识库数量限制

个人知识库最多只能创建6个,而公司知识库的数量则取决于购买的套餐数量。