[发明专利]基于对称图卷积神经网络的文献分类方法和装置有效
| 申请号: | 202110388284.6 | 申请日: | 2021-04-10 |
| 公开(公告)号: | CN112966114B | 公开(公告)日: | 2023-08-15 |
| 发明(设计)人: | 张滨;张珣;杨岚雁;岳明齐;付晶莹;刘锟 | 申请(专利权)人: | 北京工商大学;中国科学院地理科学与资源研究所 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F18/2415;G06F18/214;G06F18/22;G06N3/0464;G06N3/047;G06N3/048;G06N3/084 |
| 代理公司: | 北京中和立达知识产权代理有限公司 11756 | 代理人: | 杨磊 |
| 地址: | 100048*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 对称 图卷 神经网络 文献 分类 方法 装置 | ||
1.一种基于对称图卷积神经网络的文献分类方法,其特征在于,所述方法包括:
获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的邻接矩阵和特征矩阵,并根据特征矩阵和邻接矩阵构建相似度矩阵;
分别以所述相似度矩阵和所述邻接矩阵作为聚合矩阵,对所述文献引用数据的特征矩阵进行图卷积操作,以得到基于所述相似度矩阵的第一预测值和基于所述邻接矩阵的第二预测值;
分别计算所述文献引用数据中标记文献节点的监督损失和基于所述第一预测值和所述第二预测值的无监督损失,并将所述监督损失和无监督损失进行合并,以确定最终损失,其中,所述监督损失用于表征标记文献节点的基于所述邻接矩阵的第二预测值与真实值之间的误差,所述无监督损失用于所有文献节点的所述第二预测值与第一预测值之间的误差;
利用所述最终损失训练和预设训练集进行训练,得到目标图卷积神经网络;
使用所述目标图卷积神经网络对文献数据集中的目标文献数据进行半监督分类。
2.根据权利要求1所述的方法,其特征在于,获取文献引用数据集,利用节点表示文献,利用边表示引用连接,利用节点特征表示文献摘要的关键词,将所述文献引用数据集输入为图结构数据,生成对应的邻接矩阵和特征矩阵,并根据所述特征矩阵和邻接矩阵构建相似度矩阵,包括:
生成特征矩阵X=[X1,X2,…,Xn]T和邻接矩阵A,其中,X∈Rn×c,A∈Rn×n表示所有文献之间的引用关系,如果两篇文献之间具有引用关系,则将它们称为图中的相邻文献节点,n表示文献节点的个数,c表示特征维数;
使用第一计算公式计算任意两个相邻文献节点i和j之间的特征距离;
根据所述特征距离,使用第二计算公式计算任意两个相邻文献节点i和j之间的特征相似度系数;
采用第三计算公式,根据所有相邻文献节点的特征相似度系数构建所述相似度矩阵。
3.根据权利要求2所述的方法,其特征在于,所述第一计算公式包括:
其中,dij表示所述相邻文献节点i和j之间的特征距离,Xi∈Rc是文献节点i的c维特征向量,Xj∈Rc是文献节点j的c维特征向量;
所述第二计算公式包括:
其中,αij表示所述文献节点i和j之间的特征相似度系数,μ表示平滑参数;
所述第三计算公式包括:
4.根据权利要求3所述的方法,其特征在于,采用以下第四计算公式和第五计算公式计算基于所述相似度矩阵的第一预测值:
其中,表示所述相似度矩阵的第一预测值,S表示所述相似度矩阵,表示规范化的相似度矩阵,D表示一个对角矩阵,Dii=∑jSij,softmax表示分类器,用于预测每个文献节点属于不同类别的概率,表示基于相似度矩阵的第(t-1)层的输出,等于输入特征矩阵X,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数。
5.根据权利要求3所述的方法,其特征在于,采用以下第六计算公式和第七计算公式计算基于所述邻接矩阵的第二预测值:
其中,I表示单位矩阵,表示规范化的邻接矩阵,表示基于邻接矩阵的第(t-1)层的输出,等于输入特征矩阵X,输入特征矩阵X由所有标记和未标记的文献节点特征组成,Θ(t)表示第t层网络的可训练的权重参数,σ表示激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学;中国科学院地理科学与资源研究所,未经北京工商大学;中国科学院地理科学与资源研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110388284.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:膝关节康复牵伸器
- 下一篇:一种圆筒式线圈分级层间绝缘结构及其绕制方法





