[发明专利]用于文旅产业的问答数据处理方法、设备及存储介质在审
| 申请号: | 202211391424.6 | 申请日: | 2022-11-08 |
| 公开(公告)号: | CN115687592A | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 胡政;陈海江 | 申请(专利权)人: | 浙江力石科技股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06N5/02 |
| 代理公司: | 杭州云睿专利代理事务所(普通合伙) 33254 | 代理人: | 张骁敏 |
| 地址: | 310000 浙江省杭州市余杭区文一西*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 产业 问答 数据处理 方法 设备 存储 介质 | ||
1.一种用于文旅产业的问答数据处理方法,其特征在于,包括
获取第一用户问题;
对所述第一用户问题进行特征分解得到若干第一用户关键词;
根据知识库问题的特征标签计算每个用户关键词与知识库问题的相关性得分,将加权求和,得到用户问题对于每个知识库问题的第一相关性得分,选取第一相关性得分高于第一阈值的知识库问题,得到第一召回问题集合;所述知识库问题的特征标签由知识库问题特征分解得到,并与对应的知识库问题关联;
将第一用户问题和第一召回问题集合中的知识库问题通过向量编码器进行向量化转换,得到第一用户问题向量和若干知识库问题向量,所述的若干知识库问题向量与第一召回问题集合中的知识库问题一一对应,计算第一用户问题向量与各个知识库问题向量的距离并将其作为第一用户问题与第一召回问题集合中的知识库问题的第二相关性得分;
将第一找回问题集合中的知识库问题的第一相关性得分归一化处理,并将第一召回问题集合中的知识库问题的第一相关性得分和第二相关性得分各个知识库问题对应的加权得到综合相关性得分;
选取第一召回问题集合中综合相关性得分高于第二阈值的知识库问题得到第二召回问题集合;
对第一用户问题、第二召回问题集合中的知识库问题进行关键词标注,并生成对应的关键词位置掩码;
将第一用户问题、第二召回问题集合、关键词位置掩码信息和关键词位置掩码映射关系输入深度匹配模型,深度匹配模型对第二召回问题集合中知识库问题进行排序,得到问答数据集。
2.根据权利要求1所述的一种用于文旅产业的问答数据处理方法,其特征在于,具体的,第一相关性得分归一化处理时采用最大最小归一化方式,其公式为:
其中,score(x)表示归一化后的匹配得分,x是归一化前的匹配得分,max(x)和min(x)表示候选空间得分的最大匹配分数和最小匹配分数。
3.一种计算机设备,其特征在于,一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1或2所述的方法。
4.一种存储有计算机程序的存储介质,其特征在于,该程序被处理器执行时实现如权利要求1或2所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江力石科技股份有限公司,未经浙江力石科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211391424.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:涡喷发动机及其启动装置
- 下一篇:一种浮栅场效应晶体管器件及其制备方法





