[发明专利]一种面向标签噪声的图节点分类方法有效
| 申请号: | 202010625468.5 | 申请日: | 2020-07-02 |
| 公开(公告)号: | CN111966823B | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 胡金龙;陈浪;董守斌 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/955;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 标签 噪声 节点 分类 方法 | ||
本发明公开了一种面向标签噪声的图节点分类方法,包括步骤:1)构建多个图卷积网络(GCN)模型;2)在图数据上估计联合分布、剪枝噪声数据,得到初次清理的数据并训练图卷积网络模型;3)在图数据上训练图卷积网络模型,与步骤2)的图卷积网络模型一起预测未标记节点,得到伪标签和预测概率矩阵,结合带标记节点的标签和预测概率矩阵,共同估计全数据联合分布、剪枝噪声数据;4)使用步骤3)中得到的二次清理的图数据训练图卷积网络模型,并预测节点类别。本发明在图卷积网络模型的基础上引入噪声联合分布估计和伪标签结合的标签噪声建模方法进行噪声鲁棒性训练,实现了具有更高准确性和噪声鲁棒性的节点分类方法。
技术领域
本发明涉及数据挖掘的技术领域,尤其是指一种面向标签噪声的图节点分类方法。
背景技术
近年来,随着互联网技术的快速发展,社会迅速地进入大数据时代,大量的数据、信息不断涌现,以点和边的拓扑图形式表现的图结构数据广泛存在于社交网络、交通流网络等领域。节点分类,即在图上挖掘节点关系、为节点实体分类,作为图数据分析的一项常见任务在社交分析、交通流预测和疾病预测中发挥着重要作用。
传统的节点分类方法,如基于邻接矩阵的网络表示方法由于高维度和数据稀疏性问题在大数据环境下难以推广,图嵌入学习和网络表示学习方法则受限于浅层学习机制而无法挖掘图数据中的复杂模型,且这些方法都容易受到数据中标签噪声的干扰而影响分类准确性和鲁棒性。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种面向标签噪声的图节点分类方法,该方法构建了多个图卷积网络模型用于执行节点分类任务,并基于估计噪声标签与真实标签之间的联合分布的方法和伪标签方法来建模、剪枝图数据中的标签噪声,将清理后的图数据用于图卷积网络模型的训练,从而提升图卷积网络模型在大规模图数据下节点分类的准确性和鲁棒性。
为实现上述目的,本发明所提供的技术方案为:一种面向标签噪声的图节点分类方法,包括以下步骤:
1)构建三个网络结构、推断过程、训练过程均相同的图卷积网络模型,分别为第一图卷积网络模型、第二图卷积网络模型和第三图卷积网络模型,其中第一图卷积网络模型和第二图卷积网络模型用于全数据联合分布(即在带标记节点与未标记节点上估计的联合分布)的估计,第三图卷积网络模型用于节点分类、预测未标记节点的标签;
2)在图数据上估计带标记节点中可观察的噪声标签与潜在的真实标签之间的联合分布,剪枝噪声数据得到初次清理的图数据,并训练第一图卷积网络模型;
3)在图数据上训练第二图卷积网络模型,与步骤2)的第一图卷积网络模型一起预测图数据上未标记节点,分别得到伪标签和预测概率矩阵,结合带标记节点的标签和预测概率矩阵共同估计全数据联合分布并剪枝噪声数据,得到二次清理的图数据;
4)使用步骤3)得到的二次清理的图数据训练第三图卷积网络模型,并预测未标记节点的标签。
在步骤1)中,所构建的图卷积网络模型的网络结构、推断过程、训练过程如下:
所构建的图卷积网络模型f(·)由一层输入层、若干层隐藏层和一层输出层组成;图数据G=(V,E,A,X)被用于图卷积网络模型的训练,V和E分别表示图中节点和边的集合;f(·)接收节点特征矩阵X为输入,根据邻接矩阵A学习节点新的特征表示,使得相邻节点具有相似的特征表示,由此对未标记节点的标签进行平滑的标签传播:
其中,表示模型预测的标签,即类别;Θ表示图卷积网络模型的参数;
所构建图卷积网络模型的推断及训练过程分为以下四步:
1.1)对邻接矩阵A进行重归一化,为每个顶点添加一个自循环连接,由此得到新的邻接矩阵和度矩阵其中I为与邻接矩阵大小一致的单位矩阵,接着得出重归一化后的邻接矩阵
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010625468.5/2.html,转载请声明来源钻瓜专利网。





