[发明专利]一种化学分子结构的图神经网络表征方法有效
申请号: | 202110589957.4 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113314189B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 李建欣;孙庆赟;杨贝宁;彭浩;季诚;傅星珵 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G16C10/00 | 分类号: | G16C10/00;G16C20/40;G16C20/70;G06N3/04;G06N3/08 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 化学 分子结构 神经网络 表征 方法 | ||
本发明通过机器学习领域的方法,实现了一种化学分子结构的图神经网络表征方法。包括三个步骤,步骤一为子图采样和编码步骤,进行子图采样并使用图神经网络对子图进行编码;步骤二为显著性子图选择步骤,引入强化学习筛选显著子图机制构建有限的马尔可夫过程解决显著子图选择中先验知识不足的问题;步骤三为子图骨架图构建和层次化聚合步骤,构造子图骨架图并进行子图内和子图间的层次化信息聚合,并通过自监督互信息增强机制,实现一个图神经网络表征新框架,最终实现自动高精度获得子图表征、自适应地捕捉化学分子结构的重要局部结构、可明确指出导致化学分子结构性质预测结果的具体局部结构的方法。
技术领域
本发明涉及机器学习领域,尤其涉及一种化学分子结构的图神经网络表征方法。
背景技术
化学分子性质预测是化学和生物学中的一个重要问题。在化学分子性质预测中,一个重要的方面在于化学分子是如何被表征的。几十年来在定量构效关系(QSAR)研究和分子相似性分析方面的药物发现研究表明,准确的预测依赖于化学分子特征的选择,而识别关键的结构特征对于揭示化学分子活性和性质关系至关重要。例如,在药物发现中,化学家通过寻找小分子先导物,并在治疗性发现中优化类药物的特性。图可以用于建模化学分子中各原子之间的复杂关系,在生物信息学分析等领域取得了广泛的应用。随着深度学习的发展,深度图神经网络被引入化学分子结构表征领域中。通过学习基于图的表征,可以捕获顺序、拓扑、几何等结构特征。然而,现有的嵌入表示方法大多集中在节点层级(将化学分子中每个原子表征为一个向量)和整图层级(将整个化学分子表征为一个向量),无法捕捉化学分子结构中关键性的子结构(子图),这对于化学分子结构表征分析是不够的。本发明综合研究了子图发现和全图嵌入表示技术,提出一种通过图神经网络表征的的化学分子结构性质预测方法。
目前的深度图神经网络在化学分子结构表征中有以下两点局限性:(1)只能产生节点层级和整图层级的表征,难以发现对化学分子结构表征产生重要影响的局部结构;(2)依赖于人手工构造的规则提取局部结构(子图),缺少自适应性,如果在特定领域的先验知识不足,无法学习出准确高效的模型。本发明针对化学分子结构表征中局部结构抽取和领域知识的问题,提出了基于强化子图神经网络的化学分子结构表征与性质预测方法。
发明内容
为此,本发明首先提出一种化学分子结构的图神经网络表征方法,包括三个步骤,具体地,步骤一为子图采样和编码步骤,对输入的化学分子结构建模为图后,进行子图采样并使用图神经网络对子图进行编码;步骤二为显著性子图筛选步骤,引入强化学习筛选显著子图机制构建有限的马尔可夫过程解决显著子图筛选中先验知识不足的问题;步骤三为子图骨架图构建和层次化聚合步骤,构造子图骨架图并进行子图内和子图间的层次化信息聚合,并通过自监督互信息增强机制,实现一个图神经网络表征新框架,对每个子图进行分类并将分类结果投票,并将所述图神经网络表征新框架应用至分子性质预测中,最终实现化学分子结构的表征学习和性质预测。
所述子图采样并使用图神经网络对子图进行编码具体方法为:给定一个图按度降序对图中的所有节点进行排序,并选择前个节点作为子图的中心节点,然后,对于每个中心节点,通过广度优先搜索提取一个大小为s的子图,以最大化原始图结构的覆盖范围,从原始图中抽取n个子图{g1,g2,...,gn};其次,学习一个基于图神经网络的编码器ε(gi),以获取子图中的节点表示:
然后,使用基于强化学习的top-k筛选策略筛选n'=k*n个显著子图;最后,通过子图内的注意机制来学习子图中节点的重要性及其相互作用,并将节点表征嵌入到同一空间中,获得子图表征:
cj为节点vj的注意力系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110589957.4/2.html,转载请声明来源钻瓜专利网。