[发明专利]数据检索方法及装置在审
| 申请号: | 202110780589.1 | 申请日: | 2021-07-09 |
| 公开(公告)号: | CN113449174A | 公开(公告)日: | 2021-09-28 |
| 发明(设计)人: | 严琳;韩路;徐雅光;肖柯舟 | 申请(专利权)人: | 中国银行股份有限公司 |
| 主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/9535;G06N20/00 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王天尧;谷敬丽 |
| 地址: | 100818 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 检索 方法 装置 | ||
1.一种数据检索方法,其特征在于,包括:
根据用户的检索请求,确定多个查询意图;所述查询意图用于表征与用户检索请求的语意对应的检索关键字;
将对应该检索请求的多个查询意图作为输入数据,输入到查询意图边界识别机器学习模型,得到查询意图边界;所述查询意图边界识别机器学习模型根据历史用户查询意图数据,对机器学习模型训练得到;所述历史用户查询意图数据包括:对应不同用户的:查询意图和查询意图边界的历史数据;
根据查询意图边界,对多个查询意图进行分类排序,确定查询意图边界范围内的多个查询意图;
根据用户的查询意图与用户社交网络信息间的关联关系,对查询意图边界范围内的多个查询意图进行筛选和重新排序;
根据查询意图边界范围内的多个经筛选和重新排序的查询意图,确定数据检索结果。
2.如权利要求1所述的方法,其特征在于,所述查询意图边界识别机器学习模型按如下方式根据对应该检索请求的多个查询意图,确定查询意图边界:
根据对应该检索请求的多个查询意图,确定多个查询意图间的点击相似度和内容相似度;
根据多个查询意图间的点击相似度和内容相似度,确定查询意图边界。
3.如权利要求1所述的方法,其特征在于,还包括:
按如下方式建立查询意图边界识别机器学习模型:
将历史用户查询意图数据划分为训练数据集和测试数据集;
根据机器学习算法,以训练数据集,对机器学习模型进行训练,获得查询意图边界识别机器学习模型;
以测试数据集,对训练好的查询意图边界识别机器学习模型进行测试。
4.如权利要求1所述的方法,其特征在于,还包括:按如下方式建立用户的查询意图与用户社交网络信息间的关联关系:
根据爬虫技术,获取用户社交网络信息;所述用户社交网络信息包括与用户cookie数据对应的不同社交网站的检索信息;
根据用户社交网络信息,确定用户的兴趣关注点;
将用户的查询意图的历史数据,与用户的兴趣关注点进行匹配,得到用户的查询意图与用户社交网络信息间的关联关系;
根据用户的查询意图与用户社交网络信息间的关联关系,对查询意图边界范围内的多个查询意图进行筛选和重新排序,包括:
根据用户的查询意图与用户社交网络信息间的关联关系,对查询意图边界范围内的多个查询意图进行筛选,得到与所述关联关系匹配的多个查询意图;
对与所述关联关系匹配的多个查询意图,按照用户的兴趣关注点的权重从小到大的顺序,进行重新排序。
5.如权利要求1所述的方法,其特征在于,还包括:
将对应该检索请求的多个查询意图作为输入数据,输入到查询意图满意度计算学习模型,得到不同的查询意图的满意度;所述查询意图满意度计算学习模型根据历史用户查询意图满意度数据,对机器学习模型训练得到;所述历史用户查询意图满意度数据包括:对应不同用户的:查询意图和查询意图满意度的历史数据;所述历史用户查询意图满意度数据通过对用户鼠标操作数据进行定量分析得出;所述用户鼠标操作数据为用户在不同查询意图所对应的页面的滑动轨迹、点击行为和停留时长数据;所述定量分析用于对用户鼠标操作数据进行滑动鼠标动量的角度和动能的计算;
根据用户的查询意图与用户社交网络信息间的关联关系,对查询意图边界范围内的多个查询意图进行筛选和重新排序,包括:
根据用户的查询意图与用户社交网络信息间的关联关系,和不同的查询意图的满意度,对查询意图边界范围内的多个查询意图进行筛选和重新排序。
6.如权利要求1所述的方法,其特征在于,还包括:
按如下方式建立查询意图满意度计算学习模型:
将历史用户查询意图满意度数据划分为训练数据集和测试数据集;
根据机器学习算法,以训练数据集,对机器学习模型进行训练,获得查询意图满意度计算学习模型;
以测试数据集,对训练好的查询意图满意度计算学习模型进行测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110780589.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种广告发布方法和装置
- 下一篇:基于多粒度互信息最大化的图分类方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





