[发明专利]基于图神经网络的化合物分类方法有效
| 申请号: | 202110419531.4 | 申请日: | 2021-04-19 |
| 公开(公告)号: | CN113066537B | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 解宇;马芷璇;张琛;鱼滨;刘公绪;温超 | 申请(专利权)人: | 山西大学;西安电子科技大学 |
| 主分类号: | G16C20/30 | 分类号: | G16C20/30;G06N3/04 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
| 地址: | 030006 山*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 神经网络 化合物 分类 方法 | ||
1.一种基于图神经网络的化合物分类方法,其特征在于,构建两个图神经网络,采用预训练方法约束两个图神经网络对同一化合物输出的一致性,采用协同训练方法生成伪标签提高对不带有类别标签的化合物的利用率,采用自训练方法对化合物建模生成的图结构进行学习;该方法的具体步骤包括:
(1)构建图神经网络:
(1a)搭建两个结构相同的10层的图神经网络GNN1和GNN2,每个图神经网络的结构依次为:第一全连接层,第一正则化层,第二全连接层,第二正则化层,卷积层,池化层,第三全连接层,第三正则化层,激活层,输出层;
(1b)将图神经网络GNN1中的第一至第三全连接层的参数分别设置为1000*256,256*128,128*64,第一至第三正则化层的大小分别设置为256,128和64,池化层设置为平均池化方式,激活层采用Softmax函数;将图神经网络GNN2中的第一至第三全连接层的参数分别设置为1000*256,256*128,128*64,第一至第三正则化层的大小分别设置为256,128和64,池化层设置为最大池化方式,激活层采用Softmax函数;
(2)生成两个训练集:
(2a)随机选取至少3000个带有类别标签的化合物组成第一样本集,随机选取至少2000个不带有类别标签的化合物组成第二样本集,每个样本集中的每个化合物均包含其内部的原子,原子间的连接关系以及原子的特征向量矩阵;
(2b)分别对第一、第二样本集中的每个化合物进行建模,生成由节点和连接边组成的图结构,将第一、第二样本集建模后的图结构分别组成带有类别标签的训练集和不带有类别标签的训练集;
(3)训练图神经网络:
(3a)将带有类别标签的训练集分别输入到两个图神经网络GNN1与GNN2中迭代更新网络参数,直至初步预训练的损失函数预测得到的类别标签与实际类别标签之间的差异值收敛为止,得到初步预训练好的两个图神经网络;
(3b)将不带有类别标签的训练集分别输入到初步预训练好的两个图神经网络GNN1与GNN2中迭代更新网络参数,直至JS散度函数收敛为止,得到预训练好的两个图神经网络GNN1与GNN2;
(3c)将不带有类别标签的训练集输入到预训练好的图神经网络GNN1中,输出带有伪标签的化合物图结构,将带有伪标签的化合物图结构输入到预训练好的GNN2中进行协同训练,直至协同训练的损失函数收敛为止,得到协同训练好的图神经网络GNN2;采用与协同训练图神经网络GNN2相同的方法得到协同训练好的图神经网络GNN1;
(3d)选取伪标签中每个类别标签中概率最高的10个化合物图结构加入到带有类别标签的训练集中,并将其分别输入到协同训练好的两个图神经网络GNN1与GNN2中迭代更新网络参数,直至自训练的损失函数收敛为止,得到自训练好的两个图神经网络GNN1与GNN2;
(4)对不包含类别标签的化合物进行分类:
对一个待分类的不包含类别标签的化合物建模为图结构,将建模后的待分类化合物图结构分别输入到自训练好的两个图神经网络GNN1与GNN2中,每个网络输出一个预测概率特征向量,将两个向量的平均值作为该化合物图结构的最终预测概率特征向量;将最终预测概率特征向量中的最大概率值对应的类别作为该化合物图结构的类别。
2.根据权利要求1所述的基于图神经网络的化合物分类方法,其特征在于,步骤(2b)中所述分别对第一、第二样本集中的每个化合物进行建模的步骤如下:
第一步,将第一、第二样本集中的每个化合物输入到计算机中,将化合物内的每个原子映射为以序号0开始的节点;
第二步,将每个化合物内的原子连接关系映射为节点的连接边;
第三步,将化合物的类别标签映射为以序号0开始的图标签;
第四步,将上述三步得到的节点、边和图标签组合为该化合物对应的图结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学;西安电子科技大学,未经山西大学;西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110419531.4/1.html,转载请声明来源钻瓜专利网。





