[发明专利]一种信息检索结果排序方法、计算机设备和存储介质在审
| 申请号: | 202010656908.3 | 申请日: | 2020-07-09 |
| 公开(公告)号: | CN111831936A | 公开(公告)日: | 2020-10-27 |
| 发明(设计)人: | 黎阳;申义;侯颖;刘大伟;王涛 | 申请(专利权)人: | 威海天鑫现代服务技术研究院有限公司 |
| 主分类号: | G06F16/9538 | 分类号: | G06F16/9538 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 264200 山东省威海市火炬高*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息 检索 结果 排序 方法 计算机 设备 存储 介质 | ||
1.一种信息检索结果排序方法,其特征在于,包括以下步骤:
标注训练数据
寻找与查询相关的文档,并对文档进行相关度排序;
文本特征抽取
确定文档的特征数量,将所述文档转换成特征向量,形成包含有特征向量和相关度的训练实例;
训练学习函数
定义Q={q1,q2,L,qm}为查询集,qi为第i个查询,D为与查询集Q相关的文档集,其中,Di={di,1,di,2,L,di,ni}为与qi查询相关的文档集,di,j表示文档集Di中的第i个文档,Y={1,2,L,1}是相关度集,其中,yi={yi,1,yi,2,L,yi,ni}为与qi查询相关的文档相关度集;
由此可得原始训练集为特征向量由每个查询文档对(qi,di,j),i=1,2,L,m;j=1,2,,ni生成,为特征函数;
Xi={xi,1,xi,2,L xi,ni},设定训练数据集x∈X且以训练局部排序模型f(q,d)=f(x),将分数赋予给定的查询文档对(q,d),对训练数据集S'输出分数列表;
依据分数列表对文档集Di定义排名表Rankinglistπi,通过下标做双向映射,以πi表示所有文档在文档集Di内的可能映射,πi(j)代表第j个文档在πi中的排序,排序方式通过f(qi,di)对查询qi选择一个排序映射πi∈∏i和文档集Di;
使用包含有新查询和新文档的的测试集,创建特征向量xm+1,使用排序模型进行训练,根据打分进行排序,得到πm+1;
排序模型的性能评估;
评估模型检测模型MAP。
2.根据权利要求1所述的一种信息检索结果排序方法,其特征在于,所述排序模型的性能评估的步骤为:排序模型的性能评估通过比较排序模型输出的排名列表和作为基本事实给出的排名列表来进行,给定查询qi和相关文档Di,设πi是Di上的排名列表,yi是Di的相关度,以DCG来衡量排名列表,则位置k处的DCG为:
式中,G为增益函数,D为损失函数,πi(j)为di,j在πi中的位置。
3.根据权利要求1所述的一种信息检索结果排序方法,其特征在于,评估模型检测模型MAP的步骤为:
设相关性的等级分为两个级别为1和0,给定查询qi、相关文档Di、Di的排序集合πi,相关文档Di的相关度集yi,给定查询qi的平均精度为:
重复测量精度直到定位,对所得结果进行进一步平均,得到MAP。
4.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至3中任一项权利要求所述信息检索结果排序方法的步骤。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至3中任一项权利要求所述信息检索结果排序方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威海天鑫现代服务技术研究院有限公司,未经威海天鑫现代服务技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010656908.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:应用的切换显示方法、装置及电子设备
- 下一篇:一种楼宇设施可视化展示装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





