[发明专利]一种获取搜索词对应商品类目的方法和装置在审
| 申请号: | 201710963026.X | 申请日: | 2017-10-17 |
| 公开(公告)号: | CN107908615A | 公开(公告)日: | 2018-04-13 |
| 发明(设计)人: | 段赫;邵荣防;郝晖;谢群群 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
| 代理公司: | 中原信达知识产权代理有限责任公司11219 | 代理人: | 张一军,涂艳 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 获取 搜索词 对应 商品 类目 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种获取搜索词对应商品类目的方法和装置。
背景技术
目前,在一个商品搜索系统中,决定搜索结果的因子有很多,其中用户提交的搜索词所对应的商品类目是一个关键因素,会直接影响到搜索结果,然而如何从用户千奇百怪的搜索数据中获取正确的商品类目(所述类目为商品对应的类目,可以不止一级类目。),是一个复杂的问题。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有确定用户输入的搜索词对应的各商品类目,从中选择出用户所偏好的商品类目,并基于用户输入的搜索词和选择出的商品类目下的所有商品的标题词,重新确定搜索词,采用重新确定的搜索词进行搜索。但该方案没有说明如何在已有的离线数据中,不存在某个词到某个商品类目的映射关系的条件下,是怎样确定用户输入的词关联到其商品类目的。并且,现有技术需要重构搜索词,很难保证重构的精准性,最终的重构结果与用户的搜索意图很可能不一致,导致结果的偏差。同时,现有技术是离线进行数据挖掘,但在离线数据无法覆盖用户搜索时,查询无结果。
发明内容
有鉴于此,本发明实施例提供一种获取搜索词对应商品类目的方法和装置,能够快速、准确地匹配到搜索词对应的商品类目。
为实现上述目的,根据本发明实施例的一个方面,提供了一种获取搜索词对应商品类目的方法,包括接收用户输入的搜索词;判断离线数据中是否存在与所述搜索词匹配的商品类目信息,若存在则获取与所述搜索词匹配的商品类目信息;否则对所述搜索词进行分词处理以获得分词词组,并在离线数据中获取与所述词组匹配的商品类目信息。
可选地,所述在离线数据中获取与所述词组匹配的商品类目信息的步骤中,还包括:将所述词组中的词进行全组合,遍历全组合后的词组以获得匹配的商品类目信息。
可选地,所述在遍历全组合后的词组以获得匹配的商品类目信息的步骤中,包括:按照字典序对所述全组合后的词组进行排序以生成词组串,然后遍历所述词组串中的词组,在离线数据中进行匹配查找;其中,当遍历到的所述词组串中的词组长度与遍历的上一个所述词组串中的词组长度不同时,判断是否存在中间查询结果,若存在则结束遍历并获取所述中间结果作为匹配的商品类目信息,否则继续遍历所述词组串中的词组。
可选地,所述获取与所述搜索词匹配的商品类目信息或者获取与所述词组匹配的商品类目信息之后,还包括:根据预设的产品词分类补充词表和预设的品牌词分类补充词表,确定所述搜索词中存在产品词或/和品牌词,以重新确定匹配的商品类目信息。
可选地,所述获取与所述搜索词匹配的商品类目信息的同时获取所述商品类目信息对应的权值;或者所述获取与所述词组匹配的商品类目信息的同时获取所述商品类目信息对应的权值。
可选地,所述重新确定匹配的商品类目信息,包括:分别调用接口查询所述搜索词中存在的产品词的商品类目信息、品牌词的商品类目信息;将所述产品词的商品类目信息和所述品牌词的商品类目信息与所述搜索词或词组匹配的商品类目信息中的相同商品类目信息存放到相同类目信息中,剩余的所述产品词的商品类目信息和所述品牌词的商品类目信息存放在产品类目信息中,剩余的所述搜索词或词组匹配的商品类目信息存放在搜索类目信息中;将产品类目信息和搜索类目信息的内容合并为补充类目信息,将相同类目信息中各类目的权重值乘以系数0.8,并以计算结果作为相同类目信息中各类目的新权重值;将相同类目信息中各项类目的权重值之和乘以系数0.2,再除以补充类目信息中的类目总数,然后将计算结果分别与补充类目信息中各类目的权重值相加,作为补充类目信息中各类目的新权重值。
另外,根据本发明实施例的一个方面,提供了一种获取搜索词对应商品类目的装置,包括接收模块,用于接收用户输入的搜索词;判断模块,用于判断离线数据中是否存在与所述搜索词匹配的商品类目信息;匹配模块,用于根据所述判断模块的判断结果,获取与所述搜索词匹配的商品类目信息或者对所述搜索词进行分词处理以获得分词词组,并在离线数据中获取与所述词组匹配的商品类目信息。
可选地,所述匹配模块在离线数据中获取与所述词组匹配的商品类目信息的步骤中,还包括:将所述词组中的词进行全组合,遍历全组合后的词组以获得匹配的商品类目信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710963026.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于Bi‑LSTM的命名实体识别方法
- 下一篇:修饰的治疗剂及其组合物





