文本内容提取模块用于从文本中提取结构化数据,如用户姓名、手机号等。
例子:如一个牙医诊所预约助手,需从用户问题中提取出姓名、电话号码、时间等结构化信息,然后调用HTTP接口预约牙医。
历史记录
通常需要一些历史记录,才能更完整的提取用户问题。例如上图中需要提供姓名、时间和电话,用户可能一开始只给了时间和电话,没有提供自己的姓名。再经过一轮缺失提示后,用户输入了姓名,此时需要结合上一次的记录才能完整的提取出 3 个内容。
目标字段
目标字段与提取的结果相对应,从上图可以看到,每增加一个字段,输出会增加一个对应的出口。
key
字段的唯一标识,不可重复!字段描述:描述该字段是关于什么的,例如:姓名、时间、电话号码等等。
必须:是否强制模型提取该字段,可能提取出来是空字符串。
输出介绍
字段完全提取:说明用户的问题中包含需要提取的所有内容。
提取字段缺失
:与字段完全提取
对立,有缺失提取的字段时触发。完整提取结果: 一个 JSON 字符串,包含所有字段的提取结果。
目标字段提取结果:类型均为字符串。