[发明专利]搜索排序方法和装置有效
申请号: | 201510149901.1 | 申请日: | 2015-03-31 |
公开(公告)号: | CN104715063B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 张军;牛罡;吴先超;刘占一;于佃海 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 排序 方法 装置 | ||
本申请公开了搜索排序方法和装置。所述搜索排序方法包括:使用查询条目样本以及相应的正例搜索条目样本和负例搜索条目样本,对以短语向量集合为参数的预设模型进行训练,确定短语向量集合;基于短语向量集合,分别计算待响应的查询条目与对应的各搜索条目的相似度;根据相似度确定对查询条目进行响应时,各搜索条目的呈现顺序。该搜索排序方法可通过短语向量确定查询条目和搜索条目的匹配程度,并据此对搜索条目进行排序,从而进一步改善了搜索排序的准确性。
技术领域
本申请涉及互联网技术领域,具体涉及网络搜索技术领域,尤其涉及搜索排序方法和装置。
背景技术
随着互联网技术的不断发展,通过网络来搜索各类信息已经成为人们获取信息资源的主要方式之一。在搜索完成后,搜索系统通常会将获得的大量搜索结果,按照一定的先后顺序展示给用户。由于对搜索结果的排序情况代表了搜索系统对用户搜索意图的预测,因此是评价搜索是否全面、准确的重要标准之一。
现有技术在对搜索结果进行排序时,可以将短语作为将搜索的关键词句与搜索结果进行匹配的基本单位,然后根据匹配程度对搜索结果进行排序。这个方法比起之前以词为单位进行匹配排序的方法,能够在一定程度上改善对搜索结果进行排序的准确性。但是,在进行短语匹配时,其必须基于预先建立的短语表进行完全匹配,而对于短语表中未记录的短语,则又会退回到词匹配的方式,从而影响了搜索排序的准确性。
发明内容
本申请提供了一种搜索排序方法和装置,可以将短语表示为向量形式,从而可通过短语向量确定查询条目和搜索条目的匹配程度,提高了匹配精度,从而实现了改善搜索结果准确性的目的。
第一方面,本申请提供了一种搜索排序方法,包括:使用查询条目样本以及相应的正例搜索条目样本和负例搜索条目样本,对以短语向量集合为参数的预设模型进行训练,确定所述短语向量集合;基于所述短语向量集合,分别计算待响应的查询条目与对应的各搜索条目的相似度;根据所述相似度确定对所述查询条目进行响应时,所述各搜索条目的呈现顺序。
第二方面,本申请提供了一种搜索排序装置,包括:向量确定模块,用于使用查询条目样本以及相应的正例搜索条目样本和负例搜索条目样本,对以短语向量集合为参数的预设模型进行训练,确定所述短语向量集合;计算模块,用于基于所述短语向量集合,分别计算待响应的查询条目与对应的各搜索条目的相似度;排序模块,用于根据所述相似度确定对所述查询条目进行响应时,所述各搜索条目的呈现顺序。
本申请提供的搜索排序方法和装置,首先可以通过对以短语向量集合为参数的预设模型进行训练,获得大量短语的向量表示即向量短语集合,然后利用向量短语计算查询条目与各个搜索条目之间的相似度,最后根据相似度的计算结果对搜索条目进行排序。本申请可以将短语表示为向量形式,从而在对查询条目和搜索条目进行匹配时,可通过短语向量确定匹配程度,提高了查询条目和搜索条目的匹配精度,从而进一步改善了搜索排序的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了可以应用本申请实施例的示例性系统架构100;
图2是本申请搜索排序方法的一个实施例的流程图;
图3是本申请搜索排序方法的另一个实施例的流程图;
图4是本申请分别将查询条目样本、正例搜索条目样本和负例搜索条目样本转换为以短语向量集合为参数的待定叠加向量的一个实施例的流程图;
图5是本申请例对以短语向量集合为参数的预设模型进行训练,确定短语向量集合的一个实施例的流程图;
图6是本申请基于短语向量集合,分别计算待响应的查询条目与对应的各搜索条目的相似度的一个实施例的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510149901.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多线程数据处理方法及装置
- 下一篇:一种基于网页的图片显示方法和装置