[发明专利]一种搜索结果的排序方法和装置有效
| 申请号: | 201010299100.0 | 申请日: | 2010-09-28 |
| 公开(公告)号: | CN102419755A | 公开(公告)日: | 2012-04-18 |
| 发明(设计)人: | 金华兴;郑伟;黄鹏;杨旭;林锋;冯炯;张勤 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 逯长明;王宝筠 |
| 地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 搜索 结果 排序 方法 装置 | ||
技术领域
本申请涉及通信和计算机技术领域,特别是涉及一种搜索结果的排序方法和装置。
背景技术
当用户向搜索引擎提交一个查询请求后,搜索引擎会检索到大量与用户的查询请求相关的信息。同时,搜索引擎会根据每个信息与查询请求的相关性程度,对信息进行排序,以便用户可以快速地通过搜索引擎查找到最想要的信息。
目前,搜索引擎大多利用CTR(Click-Through-Rate,点击到达率)反映每个信息与用户查询请求的相关性程度,其中,CTR为信息被点击的次数与信息被曝光次数的商。当搜索引擎计算得到每个信息的CTR后,在搜索结果列表中,按照CTR从大到小的顺序对信息进行排序。
但是,发明人在研究中发现,一个信息与用户查询请求的相关性程度往往与该信息在搜索结果列表中的位置和在搜索结果列表中的点击顺序有关。例如,在同一个搜索结果展现页面中,即使相关性相同,不同位置的信息的CTR也会不一样。或者,在先被用户点击的信息,会影响位于其后面的信息的被点击概率。
然而,现有技术中在对搜索结果进行排序的过程中一方面只考虑到了信息被点击的次数和信息被曝光的次数,而没有考虑到在整个排序过程中,信息在搜索结果列表中的位置因素和在搜索结果列表中的被点击顺序的因素,使排序时所依据的相关性分数存在较大偏差,在多数情况下把用户想要获得的信息排在了搜索结果列表的后面,最终导致对搜索结果的排序效果差。另一方面,当对搜索结果的排序效果较差的时,用户通常需要进一步浏览和点击更多的信息才能获得最想要的信息,而用户在网站上“盲目地”进行大范围的浏览和点击的过程时,势必会增加网络系统,特别是搜索引擎服务器的负载,降低了网络系统的利用率。从而增加了搜索过程对于搜索引擎服务器的消耗,同时,也浪费了搜索引擎服务器的系统资源。
发明内容
为了解决上述技术问题,本申请实施例提供了一种搜索排序方法和装置,以减少搜索过程对于搜索引擎服务器的消耗,并节省搜索引擎服务器的系统资源。
本申请实施例公开了如下技术方案:
一种搜索结果的排序方法,包括:从日志系统中提取出被曝光的日志文档;计算所述日志文档与查询请求的相关性的贝叶斯后验概率;根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中;当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;按照期望值从大到小的顺序对查询到的日志文档进行排序。
一种搜索结果的排序装置,包括:提取模块,用于从日志系统中提取出被曝光的日志文档;概率计算模块,用于计算所述日志文档与查询请求的相关性的贝叶斯后验概率;期望值计算模块,用于根据所述贝叶斯后验概率计算所述日志文档与查询请求的相关性的期望值;索引建立模块,用于将查询请求和日志文档的标识作为键,将所述日志文档与查询请求的相关性的期望值作为值存储在检索数据结构中;检索模块,用于当接收到用户提交的查询请求时,从所述检索数据结构中查询与所述用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值;排序模块,用于按照期望值从大到小的顺序对查询到的日志文档进行排序。
由上述实施例可以看出,本申请在整个排序过程中,考虑到了信息在搜索结果列表中的位置因素和在搜索结果列表中的被点击顺序的因素,即,基于贝叶斯后验概率计算日志文档与查询请求的相关性的期望值,当从检索数据结构中查询到与用户提交的查询请求相关的所有日志文档与查询请求的相关性的期望值后,按照相关性的期望值从大到小的顺序对日志文档进行排序,从而使排序时所依据的相关性更好。同时,也使用户减少浏览的时间和点击的次数,快速地获得最想要的信息,减少搜索过程对于搜索引擎服务器的消耗,并节省搜索引擎服务器的系统资源。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一种搜索结果的排序方法的一个实施例的流程图;
图2为本申请一种构建的概率模型结构示意图;
图3为本申请一种搜索结构的排序方法的另一个实施例的流程图;
图4为本申请一种搜索排序系统的结构示意图;
图5为本申请一种搜索结果的排序装置的一个实施例的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010299100.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:个人数码用品便携式充电器
- 下一篇:一种砂筒磨光机的传动装置





