[发明专利]用于文旅产业的问答数据处理方法、设备及存储介质在审
| 申请号: | 202211391424.6 | 申请日: | 2022-11-08 |
| 公开(公告)号: | CN115687592A | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 胡政;陈海江 | 申请(专利权)人: | 浙江力石科技股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06N5/02 |
| 代理公司: | 杭州云睿专利代理事务所(普通合伙) 33254 | 代理人: | 张骁敏 |
| 地址: | 310000 浙江省杭州市余杭区文一西*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 产业 问答 数据处理 方法 设备 存储 介质 | ||
本申请公开了一种用于文旅产业的问答数据处理方法、设备及存储介质,通过两级召回结构对知识库问题进行召回,能够高效精准的获取召回问题集合,本发明方案先基于关键词对知识库问题进行初筛,再通过转化为问题向量计算向量距离来选定相关知识库问题,能够快速高效得从海量的知识库问题中选取对应的召回问题集合,再深度匹配模型对问题进行排序,得到最优的问答数据集。
技术领域
本发明属于智慧旅游技术领域,具体来说是一种用于文旅产业的问答数据处理方法、设备及存储介质。
背景技术
文旅客服需要接受大量的咨询信息,若均由人工进行回复的话,效率低下且需要大量的人工成本,同时客服人员需要进行大量的重复工作,对客服从业人员造成较大的不利影响,因此问答系统的出现,给文旅客服提供了新的模式,采用知识库和文本识别技术能够很好的将一些常见问题存放在知识库内,通过文本识别进行自动答复,大大减轻客服从业人员的工作压力。
FAQ问答系统中,用户问题和知识库中的问题数据进行匹配,分为召回和排序两个阶段。一般为了保证检索效率,召回阶段使用简单的算法得到部分与用户问题相似的候选问题集合,排序阶段使用复杂的算法对用户问题和候选集合进行深层交互。由匹配的过程可知,如果召回阶段没有得到真正与用户问题Query意图相同的知识库问题,则排序阶段就不能匹配到真正与用户意图相符的答案。因此,知识库问题的召回对于FAQ问答系统来说十分的重要。
发明内容
为解决上述技术问题,本发明提供一种用于文旅产业的问答数据处理方法,通过两级召回结构对知识库问题进行召回,能够高效精准的获取召回问题集合,具体技术方案如下:一种用于文旅产业的问答数据处理方法,包括:
获取第一用户问题;
对所述第一用户问题进行特征分解得到若干第一用户关键词;
根据知识库问题的特征标签计算每个用户关键词与知识库问题的相关性得分,将加权求和,得到用户问题对于每个知识库问题的第一相关性得分,选取第一相关性得分高于第一阈值的知识库问题,得到第一召回问题集合;所述知识库问题的特征标签由知识库问题特征分解得到,并与对应的知识库问题关联;
将第一用户问题和第一召回问题集合中的知识库问题通过向量编码器进行向量化转换,得到第一用户问题向量和若干知识库问题向量,所述的若干知识库问题向量与第一召回问题集合中的知识库问题一一对应,计算第一用户问题向量与各个知识库问题向量的距离并将其作为第一用户问题与第一召回问题集合中的知识库问题的第二相关性得分;
将第一找回问题集合中的知识库问题的第一相关性得分归一化处理,并将第一召回问题集合中的知识库问题的第一相关性得分和第二相关性得分各个知识库问题对应的加权得到综合相关性得分;
选取第一召回问题集合中综合相关性得分高于第二阈值的知识库问题得到第二召回问题集合;
对第一用户问题、第二召回问题集合中的知识库问题进行关键词标注,并生成对应的关键词位置掩码;
将第一用户问题、第二召回问题集合、关键词位置掩码信息和关键词位置掩码映射关系输入深度匹配模型,深度匹配模型对第二召回问题集合中知识库问题进行排序,得到问答数据集。
具体的,第一相关性得分归一化处理时采用最大最小归一化方式,其公式为:
其中,score(x)表示归一化后的匹配得分,x是归一化前的匹配得分,max(x)和min(x)表示候选空间得分的最大匹配分数和最小匹配分数。
本发明的好处在于:先基于关键词对知识库问题进行初筛,再通过转化为问题向量计算向量距离来选定相关知识库问题,能够快速高效得从海量的知识库问题中选取对应的召回问题集合,再深度匹配模型对问题进行排序,得到最优的问答数据集。
附图说明
图1本发明一实施例提供的一种召回流程示意图。
图2为本发明一实施例提供的一种设备的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江力石科技股份有限公司,未经浙江力石科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211391424.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:涡喷发动机及其启动装置
- 下一篇:一种浮栅场效应晶体管器件及其制备方法





