[发明专利]基于图卷积网络的科技论文层级多标签分类方法及设备有效
| 申请号: | 202110548961.6 | 申请日: | 2021-05-19 |
| 公开(公告)号: | CN113312480B | 公开(公告)日: | 2022-12-09 |
| 发明(设计)人: | 薛哲;杜军平;郑长伟;寇菲菲;梁美玉 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/38;G06F40/258;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 孙晓凤 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图卷 网络 科技 论文 层级 标签 分类 方法 设备 | ||
1.一种基于图卷积网络的科技论文层级多标签分类方法,包括:
构建论文与关键词的无向图;
利用注意力机制在所述无向图上进行图形节点嵌入,输出更新后的论文节点特征,具体包括:
构建论文与关键词的特征矩阵;
输入所述论文与关键词特征矩阵的每一个行向量作为节点特征向量;
对所有节点特征经过线性变换得到输出节点特征;
利用注意力机制计算每个输出节点特征与其相邻节点特征的注意力因子,将所述注意力因子归一化得到最终的注意力因子,利用最终的注意力因子经计算得到更新后的论文节点特征;
将更新后的论文节点特征输入预先训练好的与论文类别层数相对应的多输出深度神经网络模型中,输出所有论文类别层数整体的全局标签和局部标签;
通过注意力机制组合所述局部标签和全局标签,利用组合后的局部标签和全局标签经计算处理后得到最终的论文标签分类结果。
2.根据权利要求1所述的方法,其中,利用注意力机制在所述无向图上进行图形节点嵌入,输出更新后的论文节点特征,包括:
构建论文与关键词的特征矩阵X:
其中,X为论文与关键词特征总和,X由W与P拼接得到,t=s+r,t为论文与关键词节点的总数,论文矩阵P为论文特征矩阵,r为论文总数,d为特征维度;W为关键词特征矩阵,s为关键词总数;
输入节点特征表示为h为X的行向量,R为实数集,d为特征维度;
采用一个线性层,权重矩阵为d′为隐层维度,对于节点i,记i的邻接节点j的集合为Ni,对于j∈Ni,按照下式计算i、j的注意力因子eij
其中,LeakyReLU为激活函数,为一个注意力网络,使用一个线性层实现,是1个维度为2d′的列向量,T为矩阵转置操作,||表示对向量进行拼接操作;
对所述注意力因子eij进行归一化,得到最终的注意力因子aij
其中,n表示i的邻接节点j的个数;
经过注意力机制后,按照下式计算得到更新后的论文节点特征
3.根据权利要求2所述的方法,其中,在得到更新后的论文节点特征之后,采用多头注意力机制,按照下式计算得到稳定更新后的论文节点特征
其中,k表示注意力网络的头数,K表示k的总数。
4.根据权利要求1所述的方法,其中,通过注意力机制组合所述局部标签和全局标签,利用组合后的局部标签和全局标签经计算处理后得到最终的论文标签分类结果,包括:
将所述全局标签分为多个部分,每个部分分别对应于所述论文类别层数的每一层的局部标签;
利用注意力机制调整所述全局标签和局部标签的权重并组合每一层的局部标签和全局标签,组合后经计算处理得到最终的论文标签分类结果。
5.根据权利要求1所述的方法,其中,所述将更新后的论文节点特征输入预先训练好的与论文类别层数相对应的多输出深度神经网络模型中,输出所有论文类别层数整体的全局标签,包括:
按照如下公式计算所述论文类别层数中第一层的全局输出
按照如下公式计算所述论文类别层数中第m层的全局输出
其中,表示第m层的全局输出.用于获取全局标签表示,σ是激活函数,表示第m层的全局权重矩阵,x为所述利用注意力机制得到的更新后的论文节点特征,b表示偏置量,||表示拼接操作,m表示层的序号,|M|表示层数,C表示各个层级的所有标签集合,Cm表示第m层的标签集合;
按照下式计算所有论文类别层数整体的全局输出
其中PG的第q个元素表示为第q个类别的置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110548961.6/1.html,转载请声明来源钻瓜专利网。





