[发明专利]一种搜索方法及装置有效
申请号: | 201710236272.5 | 申请日: | 2017-04-12 |
公开(公告)号: | CN106971000B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 韩雷钧 | 申请(专利权)人: | 北京焦点新干线信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06F16/957 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 方法 装置 | ||
本发明实施例中公开了一种搜索方法及装置,接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词;根据所述搜索词进行搜索得到初始的搜索结果集;对所述搜索词进行分词处理;将分词处理所得的分词在预设分类词库中进行匹配,以确定所述搜索词命中的词库类别作为目标词库类别;提高所述目标词库类别的权重数值;根据提高后的目标词库类别的权重数值对所述初始的搜索结果集重新调整,生成最终的搜索结果集;将所述最终的搜索结果集返回给所述客户端,以展示给所述用户。由于能够按照用户的搜索意图,调整用户的搜索词对应的权重数值,从而能够将更符合用户真实需求的搜索结果优先展示给用户。
技术领域
本发明涉及搜索技术领域,具体涉及一种搜索方法及装置。
背景技术
垂直搜索引擎是针对某一特定领域、某一特定人群或某一特定需求的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。
目前,垂直搜索引擎是通过用户输入的搜索关键词,按照全文搜索匹配的规则计算相关文档得分,然后按照得分由高到低的顺序将搜索结果依次输出给用户。但是,这种方法仅仅是按照系统认为的最优排序将搜索结果展示给用户,完全没有关心搜索结果排序是否符合用户的真实需求。当搜索结果排序和用户的真实需求有所差距时,将导致用户真正想要的搜索结果没有被优先展示给用户,从而影响了搜索转化率和点击率。比如,在房产领域,当用户搜索诸如城市、区县或者开发商名称这些特定类别的词汇时,垂直搜索引擎的搜索结果排序如果和用户的真实需求有所差距时,一方面将导致用户无法快速找到需要的房产信息,另一方面也影响了房产的出租或出售。
因此,如何将更符合用户真实需求的搜索结果优先展示给用户成为本领域技术人员亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种搜索方法及装置,能够将更符合用户真实需求的搜索结果优先展示给用户。
为实现上述目的,本发明实施例提供如下技术方案:
一种搜索方法,包括:
接收客户端发送的搜索请求,所述搜索请求中包括用户通过所述客户端输入的搜索词;
根据所述搜索词进行搜索得到初始的搜索结果集;
对所述搜索词进行分词处理;
将分词处理所得的分词在预设分类词库中进行匹配,以确定所述搜索词命中的词库类别作为目标词库类别;
提高所述目标词库类别的权重数值;
根据提高后的目标词库类别的权重数值对所述初始的搜索结果集重新调整,生成最终的搜索结果集;
将所述最终的搜索结果集返回给所述客户端,以展示给所述用户。
优选的,所述根据提高后的目标词库类别的权重数值对所述初始的搜索结果集重新调整,生成最终的搜索结果集,包括:
根据提高后的目标词库类别的权重数值对所述初始的搜索结果集中的各个搜索结果进行打分;
按照分数由高至低的顺序对所述初始的搜索结果集中的各个搜索结果进行排序,生成最终的搜索结果集。
优选的,所述方法还包括:
获取原始数据集;
采用词库分类器对所述原始数据集进行训练,生成预设分类词库。
优选的,所述方法还包括:
获取增量数据集;
采用词库分类器对所述增量数据集进行训练,更新所述预设分类词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京焦点新干线信息技术有限公司,未经北京焦点新干线信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710236272.5/2.html,转载请声明来源钻瓜专利网。