[发明专利]一种基于深度学习的图节点多标签分类方法在审
申请号: | 201611244725.0 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106997474A | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 李涛;王次臣;李华康 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 李湘群 |
地址: | 210023 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 节点 标签 分类 方法 | ||
1.一种基于深度学习的图节点多标签分类方法,其特征在于包含以下步骤:
步骤1:加载图数据模块,解析图数据,使用字典的形式保存,其中字典的key表示图中的某一个节点,字典的value表示该节点的邻居节点序列;
步骤2:生成游走路径模块,完成在图数据中的随机游走,返回生成游走路径;
步骤3:生成节点特征向量模块,将上一步返回的游走路径,以及指定的向量表示维数和上下文窗口大小作为输入,调用word2vec算法计算每一个图节点的特征向量表示;
步骤4:生成训练数据模块,从所有图节点中随机抽取一定百分比的节点作为训练节点数据,对于每一个节点,取其特征向量与该节点对应的标签序列组成二元组作为一个训练样本,同时,选取一定百分比的节点作为验证节点数据,剩余节点作为测试节点数据,每一个验证样本和测试样本同样采用二元组的形式;
步骤5:构建深度置信网络模型,输入层神经元个数为图节点特征向量的维数,隐层个数及神经元个数可以依据训练效果灵活调整,输出层的神经元个数为标签个数.对于每一个训练样本,其中x向量作为模型输入,y向量作为训练或测试的目标。
2.根据权利要求1所述的基于深度学习的图节点多标签分类方法,其特征在于步骤2中生成游走路径模块具体步骤为,假设指定游走次数为N,在每一次的游走中首先将图中的节点序列随机洗牌,然后依次从每一个节点开始游走,游走完成指定路径长度L后,保存游走路径path_list到路径集合Paths中,并从下一个节点继续开始游走,直到最后一个节点,根据指定的游走次数,迭代此过程若干次,返回游走路径集合,其中,path_list的形式可以表示为:path_list=[S,n1,n2,L,nL-1],其中,S为起始节点,后面是游走到的节点序列。
3.根据权利要求1所述的基于深度学习的图节点多标签分类方法,其特征在于步骤5中深度置信网络模型训练过程为:首先使用训练样本对RBM进行逐层预训练,使得神经网络的参数取得较优的初始值,然后使用通过RBM学习得到的样本的新的特征表示对逻辑回归模型进行有监督的训练,使用的是训练样本数据;每一轮训练后,根据反向传播原理,使用验证样本依据分类效果对全网参数进行微调,直到完成指定的训练轮数或者每一轮的参数更新值与原值的差小于指定的阈值,最后,使用训练好的模型对测试样本进行分类,评估分类效果。
4.根据权利要求3所述的基于深度学习的图节点多标签分类方法,其特征在于深度置信网络的训练过程可以描述为以下步骤:
1)将输入样本x作为第一个RBM结构的可见层,即x=h(0);
2)利用p(h(1)=1|h(0))或者p(h(1)|h(0))得到输入层的另一种表示,作为第二层的数据;
3)将第二层作为RBM的可见层进行训练,即把转换后的数据作为新的训练样本;
4)对所有的层迭代操作第2,3步骤;
5)以末层的逻辑回归模型的目标函数作为优化目标,对此深度置信网络中的所有的参数进行微调。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611244725.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐用太阳能储能蓄电池
- 下一篇:一种分布式光伏并网发电装置