[发明专利]一种搜索结果生成方法及信息搜索系统有效
| 申请号: | 200910146331.5 | 申请日: | 2009-06-19 |
| 公开(公告)号: | CN101930438A | 公开(公告)日: | 2010-12-29 |
| 发明(设计)人: | 郭宁;邢飞;谢宇恒;侯磊;张勤 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 逯长明;王宝筠 |
| 地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 搜索 结果 生成 方法 信息 系统 | ||
技术领域
本申请涉及计算机应用领域,特别是涉及一种搜索结果生成方法及信息搜索系统。
背景技术
信息搜索系统是一种能够为用户提供信息检索服务的系统,以互联网中常用的搜索引擎为例,作为应用在互联网领域的搜索系统,搜索引擎目前已经成为用户上网必不可少的辅助工具之一。从用户的角度看,搜索引擎一般提供一个包含搜索框的页面,用户在搜索框输入关键词或其他搜索条件,通过浏览器提交给搜索引擎后,搜索引擎就会返回与用户输入的关键词内容相匹配的信息。
针对同样的用户搜索请求(例如用户在搜索时所输入的搜索关键词),搜索引擎往往能够检索到多条匹配信息,这个数量可能会达到数十至数万。而从用户的角度来讲,往往只会重点关注在搜索结果中排序比较靠前的信息。这样,在搜索引擎向用户提供搜索结果时,如何对这些信息进行排序就显得尤为重要,搜索结果的排序是否合理将直接影响着用户的体验。
搜索引擎在对信息进行排序时,会综合考虑一种或多种因素(例如:搜索关键词在匹配信息中出现的次数、搜索关键词在匹配信息中所处的位置等等),构建形如y=f(x1,x2,...,xn)的排序模型,根据该模型为每条匹配信息进行打分,最后依据分值高低对每条匹配信息进行排序。其中,上述模型的输入参量,即函数自变量x1,x2,...,xn,分别表示所考虑的各种因素,称为匹配信息的特征,模型的输出即应变量y表示匹配信息的得分值。
根据y=f(x1,x2,...,xn)具体形式的不同,可以将排序模型分为线性排序模型和非线性排序模型两大类。一般而言,相对于线性排序模型,非线性排序模型的拟合能力更强,因此使用非线性排序模型可以实现更好的搜索效果(即匹配信息的排列顺序更符合用户的实际需求,或者与用户期待的顺序更趋于一致)。但是,由于非线性排序模型的复杂度高,因此,其处理速度较为缓慢。特别是在对大量匹配信息进行排序处理时,需要占用很长的时间来生成搜索结果,对用户体验造成了影响。
发明内容
为解决上述技术问题,本申请提供一种搜索结果生成方法及信息搜索系统,以提高对匹配信息排序的处理速度,提升用户体验,技术方案如下:
本申请提供一种搜索结果生成方法,包括:
信息搜索系统接收搜索请求,通过检索获得与所述搜索请求相匹配的各条匹配信息;
使用线性排序模型对所述各条匹配信息中的N1条匹配信息进行排序,得到第一排序结果,其中,N1≤所检索到的匹配信息的总数目;
使用非线性排序模型对所述第一排序结果中的前N2条匹配信息进行排序,得到第二排序结果,其中N2<N1;
根据所述第二排序结果,生成搜索结果。
本申请还提供一种信息搜索系统,其特征在于,包括:
信息检索单元,用于接收搜索请求,通过检索获得与所述搜索请求相匹配的各条匹配信息;
线性排序单元,用于使用线性排序模型对所述信息检索单元检索获得的各条匹配信息中的N1条匹配信息进行排序,得到第一排序结果,其中,N1≤所检索到的匹配信息的总数目;
非线性排序单元,用于使用非线性排序模型对所述线性排序单元排序得到的第一排序结果中的前N2条匹配信息进行排序,得到第二排序结果,其中N2<N1;
与现有技术相比,本申请实施例所提供的技术方案,首先使用线性排序模型对N1条匹配信息进行排序处理,然后对排序结果的前N2条再使用非线性排序模型进行排序处理。由于线性排序模型的处理速度是能够保证的,因此对于大量(N1条)的匹配信息,首先利用线性排序模型进行预处理,然后通过设置N2<N1,可以有效减小使用非线性排序模型所处理的数据量,从而提高对匹配信息排序的整体处理速度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例一的搜索结果生成方法的流程图;
图2为本申请实施例二的搜索结果生成方法的流程图;
图3为本申请实施例二的搜索效果示意图;
图4为本申请实施例信息搜索系统的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910146331.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据业务系统及数据业务实现方法
- 下一篇:硬盘系统及其存取方法





