[发明专利]一种商品搜索的查询策略的生成方法及装置有效
申请号: | 201910909527.9 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110727862B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 陈兵;关超伟;后永涛;刘艳荣 | 申请(专利权)人: | 苏宁云计算有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/279;G06F16/951 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 张慧娟 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 商品 搜索 查询 策略 生成 方法 装置 | ||
本发明公开了一种商品搜索的查询策略的生成方法及装置,该方法包括:当搜索语句的长度满足第一阈值时,选取匹配范围限制策略,否则,选取字段加权策略;当选取的是匹配范围限制策略时,若搜索语句的分词结果中的分词与预先获取的离线数据中的短语窗口匹配成功,则根据匹配成功的短语窗口对搜索语句进行匹配范围限制,生成查询策略;当选取的是字段加权策略时,若搜索语句的分词结果中的分词中包含离线数据中的查询意图的特征词,则对分词结果中的分词对应的查询意图字段进行加权,生成查询策略。本发明通过根据匹配范围限制策略或者字段加权策略来生成查询策略,提升不同类型搜索的排序效果,在兼顾召回率的条件下提升候选商品的排序相关性。
技术领域
本发明涉及互联网电子商务商品搜索技术领域,特别涉及一种商品搜索的查询策略的生成方法及装置。
背景技术
现有技术中,搜索通常是针对词语字面文本符号进行匹配的,即针对搜索词语进行分词,然后遍历商品所有字段信息,如果一个商品包含搜索词语的全部或大部分term(指分词结果中的分词),则该商品会被匹配,但因其它因素影响,该商品可能并不符合搜索预期,会存在以下现象:
1、Term之间共同出现规律不强的长尾词语搜索效果不好;
2、配件排序会出现在主件前面的紊乱现象;
3、意图搜索区分能力弱,主要涉及“试用/拼购/生鲜/店铺/二手/促销词”等。
因此,亟需提出一种新的商品搜索的查询策略的生成方法,已解决上述问题。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种商品搜索的查询策略的生成方法及装置,以克服现有技术中搜索结果中的商品与搜索语句的相关性不强等问题。
为解决上述一个或多个技术问题,本发明采用的技术方案是:
一方面,提供了一种商品搜索的查询策略的生成方法,该方法包括如下步骤:
当搜索语句的长度满足第一阈值时,选取匹配范围限制策略,否则,选取字段加权策略;
当选取的是匹配范围限制策略时,若所述搜索语句的分词结果中的分词与预先获取的离线数据中的短语窗口匹配成功,则根据匹配成功的短语窗口对所述搜索语句进行匹配范围限制,生成查询策略;
当选取的是字段加权策略时,若所述搜索语句的分词结果中的分词中包含所述离线数据中的查询意图的特征词,则对所述分词结果中的分词对应的查询意图字段进行加权,生成查询策略。
进一步的,所述离线数据还包括短语词以及字段分类及其概率。
进一步的,若所述搜索语句的分词结果中的分词与预先获取的离线数据中的短语窗口匹配成功,则根据匹配成功的短语窗口对所述搜索语句进行匹配范围限制,生成查询策略包括:
对所述搜索语句进行分词处理,将分词结果中的分词与所述短语词进行匹配;
若所述分词结果中的分词与所述短语词匹配成功,则根据预设的合并条件对所述分词结果中的分词进行合并;
若所述分词结果中的分词合并失败,则将所述分词结果中的分词与所述短语窗口进行匹配;
若所述分词结果中的分词与所述短语窗口匹配成功,则根据匹配成功的短语窗口对所述搜索语句进行匹配范围限制,生成查询策略。
进一步的,若所述搜索语句的分词结果中的分词与预先获取的离线数据中的短语窗口匹配成功,则根据匹配成功的短语窗口对所述搜索语句进行匹配范围限制,生成查询策略还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910909527.9/2.html,转载请声明来源钻瓜专利网。