[发明专利]一种基于异构网络的特征聚合方法、装置、设备和存储介质在审
申请号: | 201911192219.5 | 申请日: | 2019-11-28 |
公开(公告)号: | CN111625688A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 李伟;彭南博;程建波 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 张丽颖 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 特征 聚合 方法 装置 设备 存储 介质 | ||
本发明公开了一种基于异构网络的特征聚合方法、装置、设备和存储介质。该方法包括:对在预先构建的异构网络中的每个节点执行如下处理:采样当前处理的节点的多个邻居节点;获取所述节点的属性信息和所述节点的每个所述邻居节点的属性信息;按照预设的基于节点类型的聚合方法,对所述节点的属性信息和所述节点的每个所述邻居节点的属性信息执行聚合处理,得到处于预设特征空间的特征向量,将所述特征向量作为所述节点的特征向量。本发明使异构网络中节点类型相同或者不同的节点的特征向量都处于相同的特征空间,使得异构网络中的各个节点可以被视作同一类型节点,进而可以对异构网络中的各个节点进行特征分析。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于异构网络的特征聚合方法、装置、设备和存储介质。
背景技术
图(关系网络)是由节点和边组成的一种数据结构G=(V,E),其中,V表示节点,E表示边。在关系网络中,通常使用业务规则来生成节点与节点之间的边,并且根据业务规则为生成的边设置不同的权重。例如:如果两个节点使用同一个收货地址,那么在这两个节点之间建立一条边,并为该边设置相同收货地址对应的权重。
在实现本发明的过程中,发明人发现,目前,在构建关系网络时,边的建立强调业务规则,只有符合业务规则的两个节点之间才能建立边,这使得关系网络较为稀疏。而且,由于相同类型的节点的特征空间相同,即节点之间的特征维度、特征含义等均相同,所以为了便于对关系网络中的节点进行特征分析,大多采用相同类型的节点构建关系网络,如:关系网络中的节点都为用户。但是,在实际应用场景中,关系网络多为异构网络,即网络中的节点类型为多种。例如:在电商领域中,节点类型包括用户、商品、商户等。如果关系网络中的节点类型仅为用户,则关系网络仅能反映用户与用户之间的关系,而无法反映用户与商品之间的关系,也即是说,如果关系网络中的节点类型仅为用户,则仅能够对节点类型为用户的节点进行特征分析,无法对用户以外的商品、商户等节点类型的节点进行特征分析,从而无法准确分析用户对商品的偏好以及商品的购买人群。
然而,在异构网络中,虽然可以包括多种节点类型,但是不同节点类型的节点(异构节点)处于不同的特征空间,即异构节点之间的特征维度、特征含义等均不同,这导致对异构节点无法进行特征分析,依旧无法确定异构节点之间的关系。
发明内容
本发明的主要目的在于提供一种基于异构网络的特征聚合方法、装置、设备和存储介质,以解决现有技术中,由于异构网络中异构的特征向量处于不同的特征空间,导致无法对异构节点进行特征分析的问题。
为了解决上述技术问题,本发明实施例是通过以下技术方案来解决的:
本发明实施例提供了一种异构网络的特征聚合方法,包括:对预先构建的异构网络中的每个节点执行如下处理:采样当前处理的节点的多个邻居节点;针对所述每个节点,获取所述节点的属性信息和所述节点的每个所述邻居节点的属性信息;按照预设的基于节点类型的聚合方法,对所述节点的属性信息和所述节点的每个所述邻居节点的属性信息执行聚合处理,得到处于预设特征空间的特征向量,将所述特征向量作为所述节点的特征向量。
其中,所述采样当前处理的节点的多个邻居节点,包括:利用预设的随机游走算法,在所述异构网络中,采样当前处理的节点的多阶邻居节点;其中,在所述多阶邻居节点中,相同阶的邻居节点的节点类型相同,且不同阶的邻居节点的节点类型不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911192219.5/2.html,转载请声明来源钻瓜专利网。