[发明专利]一种基于人工神经网络的分子属性预测方法有效
| 申请号: | 201811258268.X | 申请日: | 2018-10-26 |
| 公开(公告)号: | CN109461475B | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 刘淇;陈恩红;陆承镪;王超;黄振亚 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/40;G16C20/50;G06N3/04 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张雪娇;赵青朵 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 人工 神经网络 分子 属性 预测 方法 | ||
本发明提供了一种基于人工神经网络的分子属性预测方法,包括:S1)对分子数据进行预处理:通过图的数据结构表征的方法,得到原子空间表征与原子构成表征;S2)建立模型:将原子空间表征与原子构成表征通过多层卷积神经网络,得到分子各级的表征,并将分子各级的表征进行组合,得到模型;S3)根据模型预测分子属性。与现有技术相比,本发明利用多层级卷积神经网络,能够利用已有数据的信息以及分子的多层级结构,从中学出分子属性和空间构成的关系,并用来预测未知分子的相关属性,因此具有较好的速度与精度。
技术领域
本发明属于材料学技术领域,尤其涉及一种基于人工神经网络的分子属性预测方法。
背景技术
从药物研发,到材料开发,都离不开分子发现。为了寻找到具有特定属性的分子来满足应用上的需求,通用的方法是遍历一个未知的可能分子的集合(称之为化学空间),在遍历过程中,研究人员通过各种方法来预测分子的属性,如果发现某分子符合要求,则记录下来做进一步研究。举例而言,对分子能量属性的预测能够帮助研究人员找到稳定的分子。
但是,化学空间往往非常庞大,一个被广泛应用的化学空间有一千六百多亿个分子。因此,一种快速的分子属性测定方法能够极大加速寻求特定分子的进程。但是传统物理上常用的密度泛函分析方法(Density Function Theory,下面简称为DFT),在时间效率上并不理想,无法对大量数据进行处理。
围绕该问题,研究者们提出了很多方法,但其中大部分仍然是基于DFT开发的。与此同时,该研究领域已经积累了许多相关的数据,但是大部分方法都无法利用这些已有的数据。
发明内容
有鉴于此,本发明要解决的技术问题在于提供一种基于人工神经网络的分子属性预测方法,该分子属性预测方法可充分利用已有的数据,且具有较好的速度与精度。
本发明提供了一种基于人工神经网络的分子属性预测方法,包括:
S1)对分子数据进行预处理:通过图的数据结构表征的方法,得到原子空间表征与原子构成表征;
S2)建立模型:将原子空间表征与原子构成表征通过多层卷积神经网络,得到分子各级的表征,并将分子各级的表征进行组合,得到模型;
S3)根据模型预测分子属性。
优选的,所述步骤S1)具体为:
分子数据包括分子的原子构成与原子的三维空间坐标;
将原子的三维空间坐标转换为原子之间的距离矩阵,然后通过径向基函数扩展为距离张量,得到原子空间表征;
将分子的原子构成进行嵌入表示,得到原子构成表征。
优选的,距离矩阵通过径向基函数扩展为距离张量,具体按照以下模型进行:
其中,x为距离矩阵中的每对距离;∩表示对元素的拼接;μi为中心点;||x-μi||表示x到第i个中心点的欧几里得距离;h为高斯核,K为最短距离到最长距离选取中心点的数量;
通过径向基函数得到张量D∈RN×N×K,N为距离矩阵中每对距离的数量。
优选的,将分子的原子构成进行嵌入表示,具体按照以下步骤进行:
用向量表示分子中的节点和边,将原子看做分子中的节点,其表示为向量a0∈RD,进而得到整个分子的节点表示矩阵A0∈RN×D,经嵌入表示得到边表征矩阵为E∈RN×D×D。
优选的,将原子空间表征与原子构成表征通过多层卷积神经网络,得到分子各级的表征具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811258268.X/2.html,转载请声明来源钻瓜专利网。





