[发明专利]检索目标的方法、装置及计算机可读存储介质在审
申请号: | 201810863272.2 | 申请日: | 2018-08-01 |
公开(公告)号: | CN110852094A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 陈立民;谢刚;尚鑫 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F16/33;G06N20/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 姜雍;刘剑波 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 目标 方法 装置 计算机 可读 存储 介质 | ||
本公开提供了一种检索目标的方法、装置及计算机可读存储介质,涉及人工智能技术领域。其中的方法包括:利用检索主题词的分词及分词组合,得到检索主题词的各个检索分量;计算各个检索分量关于检索主题词的相对长度;利用检索主题词及各个检索分量在目标群中进行检索,并根据检索主题词及各个检索分量的检索结果生成检索主题词及各个检索分量的类别分布向量;将检索主题词的类别分布向量、各个检索分量的类别分布向量以及相对长度输入预先训练的机器学习模型,得到各个检索分量关于检索主题词的相似度;将检索主题词以及相似度满足预设条件的检索分量对应的检索结果作为最终的检索结果。本公开能够准确、高效地得到与检索主题词相近的检索结果。
技术领域
本公开涉及人工智能技术领域,特别涉及一种检索目标的方法、装置及计算机可读存储介质。
背景技术
SKU(Stock Keeping Unit,库存量单位),是库存进出计量的单位,在服装、鞋类等商品中使用普遍。例如,纺织品中一个SKU通常表示规格、颜色、款式。品类则是SKU按照由宽到窄的类别组织方式,例如“家用电器”-“厨卫电器”-“燃气灶”。
商家在某个主题活动中,需要将符合主题活动的SKU组合提供给用户,而主题活动所涉及的SKU通常是跨品类的。例如“开学季”主题活动,可能需要组合“笔类”、“箱包”、“童装”等多个品类符合“开学季”主题活动的SKU,组成SKU商品池。
由此可见,商家需要响应主题活动,快速生成大量符合活动主题的SKU组成SKU商品池。随着商家业务的迅猛发展,电商运营所涉及SKU及品类数量巨大。面临如此海量SKU,根据活动主题检索出跨品类的SKU逐渐变得困难。
发明内容
本公开解决的一个技术问题是,如何根据准确、高效地得到与检索主题词相近的检索结果。
根据本公开实施例的一个方面,提供了一种检索目标的方法,包括:利用检索主题词的分词及分词组合,得到检索主题词的各个检索分量;计算各个检索分量关于检索主题词的相对长度,相对长度为各个检索分量所包含字数与检索主题词所包含字数的比值;利用检索主题词及各个检索分量在目标群中进行检索,并根据检索主题词及各个检索分量的检索结果生成检索主题词及各个检索分量的类别分布向量,类别分布向量的维度表示目标群包含的总类别数,类别分布向量的各个元素表示检索主题词或检索分量的各类检索结果的占比;将检索主题词的类别分布向量、各个检索分量的类别分布向量以及相对长度输入预先训练的机器学习模型,得到各个检索分量关于检索主题词的相似度;将检索主题词以及相似度满足预设条件的检索分量对应的检索结果,作为最终的检索结果。
在一些实施例中,该方法还包括:从各个检索分量中将相对长度小于第一阈值的检索分量删除。
在一些实施例中,该方法还包括:利用样本主题词的分词及分词组合,得到样本主题词的各个样本分量;计算各个样本分量关于样本主题词的相对长度;利用样本主题词及各个样本分量在目标群中进行检索,并根据样本主题词及各个样本分量的检索结果生成样本主题词及各个样本分量的类别分布向量;标注各个样本分量关于样本主题词的相似度;利用样本主题词及各个样本分量的类别分布向量、各个样本分量关于样本主题词的相对长度以及相似度,对机器学习模型进行训练,使得机器学习模型能够根据检索主题词的类别分布向量、检索分量的类别分布向量以及相对长度,计算得到检索分量关于检索主题词的相似度。
在一些实施例中,标注各个样本分量关于样本主题词的相似度包括:将样本分量的检索结果标为第一集合,将样本主题词的检索结果标为第二集合;将第一集合与第二集合的交集中所包含检索结果的数量,与第一集合与第二集合的并集中所包含检索结果的数量作比,得到样本分量关于样本主题词的相似度。
在一些实施例中,标注各个样本分量关于样本主题词的相似度还包括:若样本分量关于样本主题词的相似度不在预设区间内,则将评估人员输入的相似性取值作为该样本分量关于样本主题词的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810863272.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种配送站点的匹配方法和装置
- 下一篇:一种项目通讯录动态的生成方法