Skip to content
  • 文本内容提取模块用于从文本中提取结构化数据,如用户姓名、手机号等。

  • 例子:如一个牙医诊所预约助手,需从用户问题中提取出姓名、电话号码、时间等结构化信息,然后调用HTTP接口预约牙医。

历史记录

通常需要一些历史记录,才能更完整的提取用户问题。例如上图中需要提供姓名、时间和电话,用户可能一开始只给了时间和电话,没有提供自己的姓名。再经过一轮缺失提示后,用户输入了姓名,此时需要结合上一次的记录才能完整的提取出 3 个内容。

目标字段

目标字段与提取的结果相对应,从上图可以看到,每增加一个字段,输出会增加一个对应的出口。

  • key 字段的唯一标识,不可重复!

  • 字段描述:描述该字段是关于什么的,例如:姓名、时间、电话号码等等。

  • 必须:是否强制模型提取该字段,可能提取出来是空字符串。

输出介绍
  • 字段完全提取:说明用户的问题中包含需要提取的所有内容。

  • 提取字段缺失:与 字段完全提取 对立,有缺失提取的字段时触发。

  • 完整提取结果: 一个 JSON 字符串,包含所有字段的提取结果。

  • 目标字段提取结果:类型均为字符串。