[发明专利]基于特征哈希的网络表示学习方法在审
申请号: | 201910201107.5 | 申请日: | 2019-03-18 |
公开(公告)号: | CN109948242A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 公茂果;王善峰;王麒翔;张明阳;李豪;武越;张天乐 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 哈希 网络表示 构建 学习 矩阵 邻近度测量 额外训练 节点分类 节点特征 链路预测 路径集合 社区发现 神经网络 随机游走 推荐系统 网络数据 向量表示 低维 高维 降维 向量 稠密 近似 邻近 应用 网络 | ||
本发明公开了一种基于特征哈希的网络表示学习方法。其实现步骤为:构建网络数据;生成随机游走路径集合;通过计算任意节点对之间的邻近度测量值从而构建高维邻近矩阵;利用特征哈希降维生成低维稠密的节点特征向量。不同于其他基于神经网络的网络表示学习方法,本发明使用特征哈希在无须额外训练的情况下可以直接学习到节点的向量表示,并较现有方法可以获得近似甚至更好的节点表示。本发明具有实际的应用价值,可以利用其得到网络中的节点表示从而解决实际生活中的各种问题,例如节点分类,链路预测,社区发现以及推荐系统等任务。
技术领域
本发明属于复杂网络技术领域,涉及网络表示学习的方法,具体是一种基于特征哈希的网络表示学习方法,用于将网络结构信息转化为低纬稠密的向量表示。
背景技术
日常生活中个体及其之间的相互关系可以抽象地构造为网络,举例来说社交网络、引用网络和电力网络等,其中网络节点代表个体,网络中的边可以代表个体之间的关系。随着网络复杂度不断地提升,其作为信息的载体具有更多值得探索的价值。现在已有大量的研究工作关注如何将机器学习算法应用在网络问题中,例如节点分类、链路预测、推荐系统和社区检测等。然而,由于网络其结构化数据的稀疏性从而导致使其应用到机器学习算法中存在很大的局限性。因此,研究将网络中节点嵌入到连续地低维特征空间具有重要的意义,其可以反映出节点在其原网络中的邻近结构信息。
网络表示学习问题近年来已经成为网络分析领域的研究热点,问题可以简单地描述为:网络表示学习是从给定的原始网络数据中学习结构信息从而得到每个节点的向量表示。
可以有效地通过从网络中学习到的节点表示特征分析网络节点在网络中与其他各个节点的联系和扮演的角色。所以基于网络表示学习的研究是十分有必要的。
发明内容
本发明的目的在于提出一种基于特征哈希的网络表示学习方法。通过该方法可以有效地将网络的结构信息嵌入到低维稠密的特征向量中。
本发明是一种基于特征哈希的网络表示学习方法,其特征在于,包括有如下步骤:
(1)构建复杂网络数据:用图结构来表示网络数据,G=(V,E),其中,G表示一个网络拓扑图,V={v1,v2,…,vi,…,v|V|}表示节点的集合,|V|表示节点数目,vi表示第i个节点,E={eij|vi,vj∈V}表示网络中边的集合,eij表示节点vi到vj的一条边;
(2)生成随机游走路径集合:随机游走路径集合被用来作为一种探索图结构的工具,给定固定随机游走路径长度l和起始节点v∈V,生成随机游走路径的过程如下。让ci代表路径中第i个被采样到的节点,路径的起始节点c0=v,第i个被采样节点ci是从ci-1节点的一阶邻居节点集N(ci-1)中随机选择的,当路径长度满足要求时,该采样过程将会停止。当给定采样次数n时,通过上述随机游走方法对每一个节点v∈V分别执行n次从而获得路径集合Walks,该集合的大小为n·|V|。
(3)构建邻近矩阵:通过将随机游走路径中任意两节点的出现概率和距离结合成一个邻近度测量值,称为期望距离ed(u,v)。让pathu={v1,v2,...,vw+1}代表一个以节点u为中心的路径,其中w为滑动窗口大小,ed(u,v)代表节点u和v在路径中的期望距离,计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910201107.5/2.html,转载请声明来源钻瓜专利网。