[发明专利]商品图谱向量化方法、装置、电子设备及存储介质在审
申请号: | 202111480886.0 | 申请日: | 2021-12-06 |
公开(公告)号: | CN114036246A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 杨艳丽;毛建新;范亚国;陈志刚;高源;张烨 | 申请(专利权)人: | 国能(北京)商务网络有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/48;G06F16/45;G06F40/30;G06F40/289;G06F16/36;G06F16/9536;G06Q30/06 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 李建忠;孙宝海 |
地址: | 100036 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 图谱 量化 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种商品图谱向量化方法、装置、电子设备及存储介质,涉及知识图谱技术领域。该方法包括:构建商品图谱,其中,商品图谱中至少包含如下维度的实体关系:用户维度、商品维度和品类维度;根据从电商平台采集的商品数据和用户交互数据,学习商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型。本公开能够得到一个适用于商品领域的商品图谱向量化表示模型,基于该商品图谱向量化模型,能够实现商品领域的商品推荐、商品搜索、图谱补全等任务。
技术领域
本公开涉及知识图谱技术领域,尤其涉及一种商品图谱向量化方法、装置、电子设备及存储介质。
背景技术
知识图谱是大规模语义网络知识库,采取符号化的知识表示方式,利用三元组来描述具体的知识,并以有向图的形式对其进行表示和存储,具有语义丰富、结构友好、易于理解等优点。由于在表达人类先验知识上具有优良的特性,知识图谱近年来在自然语言处理、问答系统、推荐系统等诸多领域取得了广泛且成功的应用。目前,知识图谱对三元组的定义比较简单,实体之间的关系主要为继承关系或组合关系,一般只有文本模态,语义关系较为简单。
知识图谱嵌入(Knowledge Graph Embedding,KGE)学习知识库中的实体关系的向量表示。相关技术中提供的知识图谱嵌入模型,大多数情况下都是用于图谱补全任务中,还有关系抽取和智能问答两大任务,在商品领域的推荐、搜索等任务中应用较少,这是因为商品图谱数据存在噪音和数据稀疏性问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供一种商品图谱向量化方法、装置、电子设备及存储介质,至少在一定程度上克服相关技术中提供的知识图谱嵌入模型不适用于商品图谱数据的技术问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供了一种商品图谱向量化方法,该方法包括:构建商品图谱,其中,所述商品图谱中至少包含如下维度的实体关系:用户维度、商品维度和品类维度;根据从电商平台采集的商品数据和用户交互数据,学习所述商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型。
在一些实施例中,所述用户维度的实体关系包括:共同购买和共同浏览;所述商品维度的实体关系包括:相似商品和商品描述;所述品类维度的实体关系包括:商品所属类目的层级关系。
在一些实施例中,根据从电商平台采集的商品数据和用户交互数据,学习所述商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型,包括:根据采集的商品数据,确定相似商品的向量表示;使用自注意力机制从采集的商品数据和用户交互数据中,提取共同购买、共同浏览、商品描述和商品所属类目层级关系的向量表示。
在一些实施例中,根据采集的商品数据,确定相似商品的向量表示,包括:从采集的商品数据中提取各个商品的商品标题和/或商品描述信息;对各个商品的商品标题和/或商品描述信息进行分词,得到分词结果;使用word2vec模型训练方法对分词结果进行训练,得到word2vec模型在商品数据集上的模型文件;使用word2vec模型在商品数据集上的模型文件,根据各个商品的商品标题生成各个商品的向量表示;根据各个商品的向量表示,计算各个商品之间的相似度;根据各个商品之间的相似度确定相似商品,生成相似商品的向量表示。
在一些实施例中,本公开提供的商品图谱向量化方法还包括:将待执行任务的标注数据作为模型输出数据,对商品图谱向量化表示模型进行参数优化,得到适用于待执行任务的商品图谱向量化表示模型。
在一些实施例中,上述待执行任务为如下任意之一:商品知识图谱补全任务、商品搜索排序任务或商品推荐任务。
在一些实施例中,本公开提供的商品图谱向量化方法还包括:采集如下多种模态的商品数据:文字、图片或视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国能(北京)商务网络有限公司,未经国能(北京)商务网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111480886.0/2.html,转载请声明来源钻瓜专利网。