[发明专利]一种基于Monroe规则的元搜索排序Top-k聚合方法有效
| 申请号: | 202110232699.4 | 申请日: | 2021-03-03 |
| 公开(公告)号: | CN113010776B | 公开(公告)日: | 2022-12-09 |
| 发明(设计)人: | 付晓东;赵时海;刘骊;刘利军 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9035 |
| 代理公司: | 昆明明润知识产权代理事务所(普通合伙) 53215 | 代理人: | 王鹏飞 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 monroe 规则 搜索 排序 top 聚合 方法 | ||
本发明涉及一种基于Monroe规则的元搜索排序Top‑k聚合方法,属于信息处理技术领域。本发明首先采用Borda规则将独立搜索引擎对检索元素的排序关系构造为独立搜索引擎‑检索元素匹配度矩阵,然后借鉴Monroe比例代表思想将元搜索排序Top‑k聚合问题建模为寻找最大化所有独立搜索引擎总体匹配度的元素集合优化问题,最后采用贪心算法对该优化问题进行求解,将所得元素集合作为元搜索排序Top‑k聚合结果反馈给用户。本发明基于Monroe规则动态寻找最大化独立搜索引擎的总体匹配度的检索元素,综合考虑检索元素与关键词的关联性以及独立搜索引擎的比例代表性,相比于其他元搜索排序聚合方法更具公平性,更能满足用户需求。
技术领域
本发明涉及一种基于Monroe规则的元搜索排序Top-k聚合方法,属于互联网信息处理技术领域。
背景技术
搜索引擎(Search Engine)基于特定的策略和算法,对互联网上急剧增长的互联网资源进行检索和处理,帮助检索用户获取与查询关键字相关的网络信息,其核心是一个排序系统。由于互联网的网络信息量非常巨大且不断增加,独立搜索引擎面临覆盖率低、查准率低的问题,同时,个别独立搜索引擎由于受偏见或利益的影响可能存在不公平行为,如通过网站竞价、付费收录等方式来达到提高某些检索元素的综合排名。为满足用户更好的检索需求,元搜索引擎(Meta Search Engine)应运而生,其集成多个独立搜索引擎的检索结果并基于相关算法对该各排序进行聚合以获得元搜索排序聚合结果,将聚合后新的排序结果展示给检索用户。元搜索是元搜索引擎的核心技术,旨在研究如何合并独立搜索引擎的搜索结果为用户提供公平有效的排序聚合结果。各独立搜索引擎根据其特定算法得到的检索结果,即对检索元素的排序,是元搜索引擎的重要基础。
Vijaya P等(Artificial neural network-based merging score for Metasearch engine,2016,23(010):2604-2615)指出现有的元搜索技术主要包括位置聚合算法、标题聚合算法、片段聚合算法等,并提出综合考虑检索元素在独立搜索引擎中的位置、标题、内容域等信息,基于神经网络来聚合各独立搜索引擎的检索结果。
专利“基于群组划分的元搜索引擎个性化结果推荐方法”(专利申请号:201610320125.1,公布号:CN106021423A)公开了一种基于群组划分的元搜索引擎个性化结果推荐方法。该方法通过收集用户兴趣及分析用户的查询日志,将用户划分群组,然后结合同一群组用户的推荐和用户查询词之间的关联性来搜索结果。该方法存在的局限之处是:方法采用基于密度的方法对具有相同兴趣的用户进行群组划分,用户数据密度变化较大时会影响群组划分的效果,使得元搜索聚合准确性降低。
上述元搜索排序聚合方法主要考虑检索元素与关键词的相关性对独立搜索引擎的排序进行合并,但其没有考虑到某些独立搜索引擎受利益或偏见的影响会推荐与关键词相关度较高的元素,但实际上这些检索元素可能并不能真正满足用户需求。而有些搜索引擎中的检索元素虽相关性较小,却包含用户真正需要的内容。因此,仅考虑关键词与检索元素的相关性来进行元搜索会导致最终排序结果缺乏公平性。另外,目前很多元搜索排序聚合方法根据特定算法对独立搜索引擎提供的排序信息进行聚合以获得一个最终排序,但对于检索用户而言并不关注总体排序,仅需要与关键词相关性最高且相对客观的Top-k个聚合结果,且为避免元搜索反馈的信息量太过庞大,根据检索用户需求设置不同k值来反馈元搜索排序聚合结果更具合理性。
发明内容
本发明要解决的技术问题是提供一种基于Monroe规则的元搜索排序Top-k聚合方法,用于解决在元搜索过程中由于各独立搜索引擎可能存在的偏见问题和公平性不足的问题。
本发明的技术方案是:一种基于Monroe规则的元搜索排序Top-k聚合方法,具体步骤为:
Step1:采用Borda规则将各独立搜索引擎对检索元素的排序关系构造为独立搜索引擎-检索元素匹配度矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110232699.4/2.html,转载请声明来源钻瓜专利网。





