[发明专利]进行信息搜索的方法及服务器有效

专利信息
申请号: 201210137565.5 申请日: 2012-05-07
公开(公告)号: CN103389974B 公开(公告)日: 2017-12-08
发明(设计)人: 李祯孝;陈戈 申请(专利权)人: 深圳市世纪光速信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京润泽恒知识产权代理有限公司11319 代理人: 苏培华
地址: 518057 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 进行 信息 搜索 方法 服务器
【说明书】:

技术领域

发明涉及信息处理技术,尤其涉及进行信息搜索的方法及服务器。

背景技术

随着信息技术的发展和网络时代的来临,运用网络进行信息搜索,以获取需要的数据也日益普遍。

进行信息搜索包括:用户终端向进行信息搜索的服务器发送包含查询词的搜索请求,服务器接收搜索请求后,搜索出搜索结果条目,对各搜索结果条目进行初始排序,将排序后的数据结果反馈给用户终端。

一般地,常利用用户点击日志对各搜索结果条目进行初始排序。用户点击日志记录了用户搜索各查询词的信息,包括某查询词下各搜索结果条目的条目点击率。关于某查询词下某搜索结果条目的条目点击率,为用户在该查询词下点击该搜索结果条目的总次数除以用户搜索该查询词的次数,所得到的值。

现有技术中采用条目点击率对搜索结果条目进行排序,具体地,按照条目点击率,降序对搜索结果条目进行排序。条目点击率是对搜索结果满意程度的一种直接体现,一般说来,条目点击率越高的搜索结果条目,说明用户对该搜索结果条目的满意度越高,此搜索结果条目应该排在前面。然而,条目点击率本身也收到搜索结果排序的影响,排在越靠前的搜索结果条目被用户点击的概率越大,因此,并非按照条目点击率排在前面的搜索结果条目就是用户需求度高的结果,此问题称为位置偏置问题。位置偏置问题说明仅按照条目点击率对搜索结果条目进行排序,是不准确的,对排序靠后的搜索结果条目不公平。

为了解决位置偏置问题,目前多采用人工调试排序的方法对搜索结果条目进行排序,该方法中,人工为各排序位置设置位置补偿因子,所述排序位置指排在最靠前的第一位置、其后的第二位置、以及后面依次排列的第三位置、第四位置、第五位置……每个排序位置对应一个补偿因子,各个排序位置的补偿因子是由人工调试得到的经验值,且调试后的一套补偿因子适用于所有搜索结果排序中。

现有人工调试排序的方法包括:

服务器接收来自用户终端的包含查询词的搜索请求后,搜索出搜索结果条目;服务器从用户点击日志中获取各搜索结果条目的条目点击率,将所有的搜索结果条目按照条目点击率进行降序排序,每个排序位置对应一个补偿因子,将各排序位置上的搜索结果条目的条目点击率与该排序对应的补偿因子相乘,将相乘结果作为该搜索结果条目的排序分数;按照排序分数降序对搜索结果条目进行排序;将排序后的数据反馈给用户终端。

现有人工调试排序的方案中,各个排序位置的补偿因子是由人工调试得到的经验值,且调试后的一套补偿因子适用于所有搜索结果排序中;这种采用由经验值确定补偿因子的方法过于粗糙,且将一套补偿因子适用于所有搜索结果排序中,会造成补偿不准确,导致排序结果不能满足用户的查询需求。

发明内容

本发明提供了一种进行信息搜索的方法,该方法能够更加准确地对搜索结果进行排序,使排序结果更遵循用户的查询需求。

本发明提供了一种进行信息搜索的服务器,该服务器能够更加准确地对搜索结果进行排序,使排序结果更遵循用户的查询需求。

一种进行信息搜索的方法,该方法包括:

接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索得到初始排序后的搜索结果;对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值;

用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子;

将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数;按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。

一种进行信息搜索的服务器,该服务器包括估计单元、排序分数获取单元和排序反馈单元;

所述估计单元,用于接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索得到初始排序后的搜索结果;对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值,传送给所述排序分数获取单元;

所述排序分数获取单元,用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子;将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数,将排序分数发送给所述排序反馈单元;

所述排序反馈单元,用于按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210137565.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top