[发明专利]一种检索方法和系统无效
| 申请号: | 200910211788.X | 申请日: | 2009-11-12 |
| 公开(公告)号: | CN102063432A | 公开(公告)日: | 2011-05-18 |
| 发明(设计)人: | 张理;李金辉;郭瑞杰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 逯长明;王宝筠 |
| 地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 检索 方法 系统 | ||
技术领域
本申请涉及网络数据处理领域,特别涉及一种检索方法和系统。
背景技术
在搜索引擎的搜索过程中,对搜索结果按照某些属性(例如:地域、来源或主题等)进行二次排序,使得前n(n>=1)条搜索结果在属性上呈现分布的多样性,这样的现象称为搜索结果多样化。在电子商务搜索中,搜索结果通常按照结果的相关性或者时间来排序,这样的话将会导致供应商不断的发布同一种产品的信息,以使得自己的产品能够占据搜索结果的前几页,从而恶意地挤掉其他供应商的产品展示机会,而且给普通用户找到其他产品造成一定的困难。
为了避免这种现象,现有技术中,有一种通过抽取并按照相关性分级的方式进行检索的方法,其具体实现过程为:预先对搜索结果按照相关性进行分档,相关性分数值相近的搜索结果被划分到同一个档,然后再针对每个档中的搜索结果进行抽取,该抽取的方式为:选取一个字段作为多样化的依据,例如:uid(供应商的唯一标识),则搜索结果中就包括了多样化的供应商产品。在实际中,需要把搜索结果按照uid的值划分成很多子集合,属于同一个uid的搜索结果被划分到一个子集合中,并在该子集合内按照相关性分数值从大到小排序,然后抽取每个子集合中m(m>=1)个最相关的搜索结果,并把抽取出来的这些结果展现在搜索页面的前几页,这就能使得前几页的搜索结果中包含了多个不同uid的产品。
从上述过程中可以看出,在现有技术中,需要按照uid进行子集合划分并排序,虽然也在一定程度上可以实现搜索结果的多样化,但是现有技术在抽取和分档的过程中会对全部的搜索结果进行一次重新组织,这需要在系统内存中重新拷贝一份搜索结果集,这样就造成了大量的搜索引擎服务器端的资源消耗,例如时间,硬件系统的耗费等,从而导致了搜索引擎服务器端的性能降低;进一步的,每个子集合内部的排序其实并不是完全必要的,所以现有技术还进行了一部分无用的运算,这就浪费了用来进行这部分运算的系统资源;另外,现有技术采用相关性分档的做法虽然在一定程度上可以平衡搜索结果的多样性和相关性,但是也无法用一个固定的分档区间正确切分所有搜索结果集合的分布情况。如图1所示,该档位的划分对查询(Query)A是合适的,但是对于Query B的档位划分就不合适了,可以看出对于QueryA来说,相关性接近的搜索结果被划分在相同的分档区间,而对于QueryB,相关性接近的搜索结果并没有被规律的划分在同一分档区间。因此现有技术的灵活性也不够好。
总之,目前需要本领域技术人员迫切解决的一个技术问题就是:如何能够创新的提出一种检索方法,以解决现有技术中在服务器端资源过量消耗的问题。
发明内容
本申请所要解决的技术问题是提供一种检索方法,用以解决现有技术中在服务器端资源过量消耗导致的搜索引擎服务器段性能降低的问题,更进一步的,还可以提升检索方法的灵活性。
本申请还提供了一种检索系统,用以保证上述方法在实际中的实现及应用。
为了解决上述问题,本申请公开了一种检索方法,包括:
根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;
根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别;
根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值;
按照第二检索结果的预置个数和所述相关性参数值,从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。
本申请还提供了一种检索系统,该系统包括:
获取单元,用于根据客户端提交的查询数据,获得与所述查询数据相关的第一检索结果集合;
计算单元,用于根据所述集合中各个第一检索结果的第一相关性分值和预置的多样性字段,计算获取所述各个第一检索结果的第二相关性分值;所述多样性字段用于表示所述第一检索结果的属性类别;
设置单元,用于根据所述第一相关性分值和第二相关性分值生成所述各个第一检索结果的相关性参数值;
抽取单元,用于按照第二检索结果的预置个数和所述相关性参数值从所述第一检索结果集合中抽取需要向客户端展示的第二检索结果。
与现有技术相比,本申请包括以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910211788.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:透光展示面板结构
- 下一篇:一种雕刻及印刷二合一导光板及其制作方法、照明灯具





