[发明专利]面向大规模图挖掘的分布式网络表示学习方法有效
申请号: | 201711166875.9 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107818176B | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 王建民;龙明盛;刘锦韬;黄向东 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 大规模 挖掘 分布式 网络 表示 学习方法 | ||
1.一种面向大规模图挖掘的分布式网络表示学习方法,其特征在于,包括:
步骤11,分别对第一预设数目的边集中每一边集进行抽样,得到所述每一边集的子边集;所述第一预设数目的边集为对大规模图结构的所有边进行分组而得;
步骤12,将所有所述子边集发送给第二预设数目的服务端,以使得所述第二预设数目的服务端返回所有所述子边集中每条边对应节点的特征向量的内积的各分量;
步骤13,对所有所述子边集中每条边对应节点的特征向量的内积的各分量进行求和,得到所有所述子边集中每条边的内积并发送给所述第二预设数目的服务端,以供所述第二预设数目的服务端根据所有所述子边集中每条边的内积,更新所有所述子边集中每条边的起点和终点对应节点分别作为边的起点和终点时对应特征向量的各向量分块;
步骤14,若所述抽样的次数未达到预设次数,重复所述抽样以及内积的发送过程,直至所述抽样的次数达到预设次数。
2.根据权利要求1所述的方法,其特征在于,在步骤11中,所述分别对第一预设数目的边集中每一边集进行抽样,得到所述每一边集的子边集,具体包括:
获取所述大规模图结构的所有边的权值之和,作为总权值,并获取所述第一预设数目的边集中每一边集内的所有边的权值之和,作为边集权值;
根据所述总权值、边集权值和所述大规模图结构中边的数目,获取所述第一预设数目的边集中每一边集内待抽取边的数目;
在所述第一预设数目的边集中每一边集内,根据该边集的待抽取边的数目,利用别名抽样法,抽取边获得子边集。
3.根据权利要求1所述的方法,其特征在于,在步骤12中,所述第二预设数目的服务端返回所有所述子边集中每条边对应节点的特征向量的内积的各分量的离散化值;
相应地,在步骤13中,所述对所有所述子边集中每条边对应节点的特征向量的内积的各分量进行求和,得到所有所述子边集中每条边的内积并发送给所述第二预设数目的服务端,具体包括:
对所有所述子边集中每条边对应节点的特征向量的内积的各分量的离散化值进行离散化反变换后求和,得到所有所述子边集中每条边的内积;
将所有所述子边集中每条边的内积进行离散化,得到所有所述子边集中每条边的内积的离散化值并发送给所述第二预设数目的服务端。
4.一种面向大规模图挖掘的分布式网络表示学习方法,其特征在于,包括:
步骤21,接收客户端发送的所有子边集并存储至本地,对于所有所述子边集中每条边,分别计算该边起点对应节点作为边的起点时对应特征向量的各向量分块和该边终点对应节点作为边的终点时对应特征向量的各向量分块的内积,作为该边的内积的各分量,并将所有所述子边集中每条边的内积的各分量发送给所述客户端,以供所述客户端返回所有所述子边集中每条边的内积;
步骤22,对于所有所述子边集中每条边,根据该边的内积及该边起点对应节点作为边的起点时对应特征向量的各向量分块,得到该边起点对应节点作为边的起点时对应特征向量的各梯度,并根据该边的内积及该边终点对应节点作为边的终点时对应特征向量的各向量分块,得到该边终点对应节点作为边的终点时对应特征向量的各梯度;
步骤23,对于所有所述子边集中每条边,用该边起点对应节点作为边的起点时对应特征向量的各梯度更新该边起点对应节点作为边的起点时对应特征向量的各向量分块,并用该边终点对应节点作为边的终点时对应特征向量的各梯度更新该边终点对应节点作为边的终点时对应特征向量的各向量分块;
步骤24,若所述更新的次数未达到预设次数,重复所述接收动作和所述更新过程,直至所述更新的次数达到预设次数。
5.根据权利要求4所述的方法,其特征在于,所述步骤21,具体包括:
对于所有所述子边集中每条边的样本集中每一个样本,计算该样本起点对应节点作为边的起点时对应特征向量的各向量分块和该样本终点对应节点作为边的终点时对应特征向量的各向量分块的内积,作为该样本的内积的各分量;所述每条边的样本集由所述每条边的一个正样本和第三预设数目的负样本构成;
将所有所述子边集中每条边的样本集中每一个样本的内积的各分量发送给所述客户端,以供所述客户端返回所有所述子边集中每条边的正样本和第三预设数目负样本的内积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711166875.9/1.html,转载请声明来源钻瓜专利网。