[发明专利]一种融合多类型信息的网络表示方法在审

专利信息
申请号: 201710337894.7 申请日: 2017-05-15
公开(公告)号: CN107291803A 公开(公告)日: 2017-10-24
发明(设计)人: 温雯;黄家明;蔡瑞初;郝志峰;王丽娟;陈炳丰 申请(专利权)人: 广东工业大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广州市红荔专利代理有限公司44214 代理人: 吝秀梅,李彦孚
地址: 510030 *** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 类型 信息 网络 表示 方法
【说明书】:

技术领域

发明一般涉及网络中的随机游走技术、维度规约方法及最优化方法,特别是批量梯度下降方法。

背景技术

随着技术的迅速发展,各种大型的网络如雨后春笋般涌现,信息技术行业往往面临着对各种复杂网络的理解挖掘。复杂网络包括现有的社交网络(微信好友之间的关系)、文献引用网络(Citeseer、Cora、PubMed)等,而理解挖掘包括但不限于节点分类、聚类,边预测,网络主题挖掘等。比如我们可以根据微信好友之间的关系构建一张网络,通过理解挖掘,为用户推荐与其相似的用户,这里用到边预测等技术。理解挖掘需要尽量多地利用网络中提供的信息,包括网络结构信息和节点属性信息等。融合多种信息有利于提高理解挖掘的精度。

然而目前的网络挖掘,主要存在以下几个难点:1、高维度:大型网络有上亿个节点,如果不进行降维,直接利用One-hot的表示方法,将会容易导致维度灾难;2、信息源多:除了网络结构信息,还会存在节点相关的属性信息,边相关的属性信息,简单的对这些信息进行拼接,效果并不是很理想,如何有效地融合多类型信息成为了急需解决的问题;3、高度稀疏:节点之间的边并不是很多,因此网络一般都是高度稀疏的,一般的理解挖掘方法难以处理这种高度稀疏的数据。

现有的方法中,还没有一个有效的方法能够高效地解决上述诸多问题。Planetoid试图将多种信息源进行融合,然而使用了半监督的方法进行融合,导致学习出来的网络表示受限于节点标签信息,无法用于无标签的网络表示学习。此外,TADW方法则通过矩阵分解的方式尝试将两种信息源进行融合,但是不够直接,没办法给出比较圆满的解释。综上,现有的网络表示学习方法的主要局限性就是没办法直接高效地将两种信息源进行融合,学习网络表示。因此,需要对现有技术进行改进。

发明内容

本发明提供一种融合多类型信息的网络表示方法,以解决现有技术中,没办法有效融合多种信息源学习网络表示的缺点。

为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现。

提供一种融合多类型信息的网络表示方法,包括:步骤1,读取网络结构信息及节点属性信息;步骤2,将所述节点属性信息转换为向量;步骤3,利用降维技术对所述向量进行降维,生成属性特征向量;步骤4,根据所述网络结构信息,生成对应的矩阵G(V,E),其中V表示节点集合,E表示边集合;步骤5,初始化所述节点属性特征向量;步骤6,结合随机游走和滑动窗口法构建训练样本;步骤7,调整节点向量值,以获得最大化条件概率;步骤8,输出调整后的节点向量作为网络表示。

优选地,所述步骤6,利用随机游走和滑动窗口方法构建训练样本包括:步骤61,依次取网络中的每个节点,作为随机游走路径的当前节点;步骤62,从游走路径当前节点的邻居节点中随机抽取一个节点,并把它添加到游走路径的最后,并更新为当前节点;步骤63,重复上述过程,直至游走路径的长度等于自定义数值r(r>0);步骤64,生成的所有路径存放在集合S中,其中集合的大小等于节点的数量;步骤65,根据集合S,按照一定规则为步骤2中的所有元素构建正样本,每个正样本都是一个三元对,所有正样本存放在正样本集合中;步骤66,为正样本集合中的每个样本,构建负样本,每个负样本也是一个三元对,存放在负样本集合中;步骤67,合并上述正样本集合和负样本集合,以获取训练样本。

优选地,所述步骤7,包括;步骤71,将所述训练样本分成若干份;步骤72,利用批量梯度下降方法,计算上述每份样本的梯度,并更新节点向量。

与现有技术相比,本发明具有如下优点和技术效果:通过降维技术将节点属性信息进行降维,并且通过最大化条件概率使得学习到的网络表示向量有效地融合了多种信息源,克服了之前方法存在的不足与局限性。而且学习到的向量是低维度的,解决了网络理解挖掘中存在的问题:高维度、高度稀疏。学习到的向量可以直接计算节点之间的相似度,从而解决了相似度度量的问题。

附图说明

为了更清楚地说明本发明实施例技术中的技术方案,下面将对实施例技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为实施方式中融合多类型信息的网络表示方法的流程图。

具体实施方式

以下结合附图对本发明的实施方式作进一步说明,但本发明的实施不限于此。

如图1,融合多类型信息的网络表示方法的主要流程包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710337894.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top