[发明专利]一种化学分子结构的图神经网络表征方法有效
申请号: | 202110589957.4 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113314189B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 李建欣;孙庆赟;杨贝宁;彭浩;季诚;傅星珵 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G16C10/00 | 分类号: | G16C10/00;G16C20/40;G16C20/70;G06N3/04;G06N3/08 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 化学 分子结构 神经网络 表征 方法 | ||
1.一种化学分子结构的图神经网络表征方法,其特征在于:包括三个步骤,具体地,步骤一为子图采样和编码步骤,将输入的化学分子结构建模为图后,进行子图采样并使用图神经网络对子图进行编码;步骤二为显著子图筛选步骤,引入强化学习筛选显著子图机制构建有限的马尔可夫过程,解决显著子图选择中先验知识不足的问题;步骤三为子图骨架图构建和层次化聚合步骤,构造子图骨架图并进行子图内和子图间的层次化信息聚合,并通过自监督互信息增强机制,实现一个化学分子结构的图神经网络表征新框架,对每个显著子图进行分类并将分类结果投票,并将所述图神经网络表征新框架应用至化学分子结构分类中,最终进行化学分子结构的性质预测;
所述子图采样并使用图神经网络对子图进行编码具体方法为:给定一个图按节点度对图中的所有节点进行降序排序,并选择度最高的前n个节点作为子图的中心节点;从原始图中抽取n个子图{g1,g2,...,gn}后,然后,对于每个中心节点,通过广度优先搜索提取一个大小为s的子图,以最大化原始图结构的覆盖范围;其次,学习一个基于图神经网络的编码器ε(gi),以获取子图中的节点表示:
然后,使用基于强化学习的top-k筛选策略来筛选n'=k*n个显著子图;
最后,通过子图内的注意机制来学习子图中节点的重要性及其相互作用,并将节点表征嵌入到同一空间中,获得子图表征:
cj为节点vj的注意力系数,所述显著性子图筛选步骤具体为:使用top-k筛选策略来筛选显著子图,首先使用可训练向量p将子图表征zi投影到一维空间,学习子图重要性指标以度量子图的显著程度;然后依据子图重要性指标排列分布,对所有子图进行降序排序,筛选前n'个子图作为显著子图;
所述强化学习筛选显著子图机制为:使用强化学习算法自适应地更新top-k筛选的筛选比例k,筛选比例k的更新过程建模为一个有限的马尔可夫决策过程,其状态、动作、奖励和终止的定义如下:
状态se:第e轮的状态se定义为当前轮选择的子图索引;
动作ae:ae定义为对当前轮的筛选比例k增加或减少一个离散值;
奖励reward(se,ae):奖励定义为一个离散函数,若当前状态和动作下图分类任务准确率提高,则奖励为正,否则为负;
终止:如果连续周期内筛选比例k的变化不超过阈值Δk,这意味着算法已经找到了一个最佳阈值,则算法将停止,并且在下一个训练过程中保持筛选比例k不变;
使用Q-learning方法解决有限离散优化马尔可夫决策过程问题,Q函数表示为:
Q*(se,ae)=raward(se,ae)+γargmaxa'(Q*(se+1,a'));
Q-learning的选择策略为:
所述子图骨架图并进行子图内和子图间的层次化信息聚合具体方法为:首先,将所选的显著子图作为超节点集合,记为将原始图池化为一个子图骨架图:其中,超节点之间的连通关系记为:其由相应子图中的公共节点数量所决定;最后,采用子图间的注意力机制学习子图之间的结构及相互作用,捕捉更高阶的语义信息,经过子图间注意力机制的子图表征可表示为z'i;
所述自监督互信息增强机制具体实现方式为:首先,使用读出函数READOUT(·)将子图表征嵌入到一个固定长度的向量,即图全局表征:
然后,使用Jensen-Shannon互信息估计器来最大化给定(子图表征,图全局表征)对上的估计互信息,具体而言,学习一个判别器(Discriminator):
输入的(子图表征,图全局表征)对(z'n,r),二者是否来自于同一个图;最后,基于显著子图筛选与表征的图分类框架目标函数可定义为:
其中,为图分类损失函数,为互信息最大化机制中判别器损失函数,β和λ分别为判别器损失函数的权重系数和参数正则化的权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110589957.4/1.html,转载请声明来源钻瓜专利网。