[发明专利]基于结构语义融合的大规模混合图特征学习方法有效
申请号: | 201711169332.2 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107944489B | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 王建民;龙明盛;裴忠一;黄向东 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/72 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 结构 语义 融合 大规模 混合 特征 学习方法 | ||
本发明提供一种基于结构语义融合的大规模混合图特征学习方法,包括:获取训练语义标签信息集Strain,获取节点对集Pe,Pe={(u,v)},遍历节点对(u,v);判断遍历节点对(u,v)是否完成;若判断获知遍历节点对(u,v)未完成,则对节点u进行负采样,并计算相连损失函数和不相连损失函数;若判断获知节点u在Vtrain中,则根据Strain计算语义损失函数;更新节点u的初始化特征表示、节点v的初始化特征表示以及负采样得到的节点的初始化特征表示;重复判断遍历节点对(u,v)是否完成,直到遍历节点对(u,v)完成。本发明提供的基于结构语义融合的大规模混合图特征学习方法,根据语义标签信息对节点的特征表示进行校正,将语义标签信息作为图特征学习的一部分,提高了图特征学习的质量。
技术领域
本发明涉及计算机数据分析技术领域,尤其涉及一种基于结构语义融合的大规模混合图特征学习方法。
背景技术
从图中可以挖掘大量有价值的信息,例如哪些节点具有较高的相似度,哪些节点形成了一个社区,可能存在哪些潜在的连接关系等。图特征学习作为图数据挖掘领域的一个重要技术,为在图数据上应用机器学习算法提供了基础。图特征学习的目标是为图中每个节点生成一个特征向量,以作为机器学习算法的输入,得到符合图特性的分析结果或者模型。
现有技术中公开了多种图特征学习方法,其中大批工作针对如何保持图结构的问题被提出,并且这类基于连接结构的图特征学习方法取得了很好的效果。但是在实际应用中,图节点经常带有一些标签,比如社交网络中个人的教育背景、职业背景、兴趣爱好,内容分享网站中博客和图文的标签、分组等。这些标签对于图数据挖掘问题具有重要意义,而这些标签包含的信息往往无法通过基于连接结构的图特征学习方法挖掘到。另外,有一些研究工作基于图节点社区信息、图节点附带的文本或图片信息来进行图特征学习。
现有技术中基于连接结构的图特征学习方法无法挖掘到图节点标签包含的信息,而基于图节点社区信息、图节点附带的文本或图片信息来进行图特征学习的方法不适用于对标签信息的挖掘,也不能法挖掘到图节点标签包含的信息,图特征学习的质量较低。
发明内容
(一)要解决的技术问题
本发明的目的是提供一种基于结构语义融合的大规模混合图特征学习方法,解决了现有技术中的图特征学习方法不能挖掘到图节点标签包含的信息,以及图特征学习质量较低的技术问题。
(二)技术方案
为了解决上述技术问题,一方面,本发明提供一种基于结构语义融合的大规模混合图特征学习方法,包括:
获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;
获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;
遍历所述节点对集Pe中的所有节点对(u,v);
判断所述遍历是否完成;
若判断获知所述遍历未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;
若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711169332.2/2.html,转载请声明来源钻瓜专利网。