[发明专利]一种基于人工神经网络的分子属性预测方法有效
| 申请号: | 201811258268.X | 申请日: | 2018-10-26 |
| 公开(公告)号: | CN109461475B | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 刘淇;陈恩红;陆承镪;王超;黄振亚 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/40;G16C20/50;G06N3/04 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张雪娇;赵青朵 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 人工 神经网络 分子 属性 预测 方法 | ||
1.一种基于人工神经网络的分子属性预测方法,其特征在于,包括以下步骤:
S1)对分子数据进行预处理:通过图的数据结构表征的方法,得到原子空间表征与原子构成表征;
S2)建立模型:将原子空间表征与原子构成表征通过多层卷积神经网络,得到分子各级的表征,并将分子各级的表征进行组合,得到模型;
S3)根据模型预测分子属性;
所述步骤S1)具体为:
分子数据包括分子的原子构成与原子的三维空间坐标;
将原子的三维空间坐标转换为原子之间的距离矩阵,然后通过径向基函数扩展为距离张量,得到原子空间表征;
将分子的原子构成进行嵌入表示,得到原子构成表征;
距离矩阵通过径向基函数扩展为距离张量,具体按照以下模型进行:
其中,x为距离矩阵中的每对距离;∩表示对元素的拼接;μi为中心点;||x-μi||表示x到第i个中心点的欧几里得距离;h为高斯核,K为最短距离到最长距离选取中心点的数量;
通过径向基函数得到张量D∈RN×N×K,N为距离矩阵中每对距离的数量。
2.根据权利要求1所述的分子属性预测方法,其特征在于,将分子的原子构成进行嵌入表示,具体按照以下步骤进行:
用向量表示分子中的节点和边,将原子看做分子中的节点,其表示为向量a0∈RD,进而得到整个分子的节点表示矩阵A0∈RN×D,经嵌入表示得到边表征矩阵为E∈RN×D×D。
3.根据权利要求2所述的分子属性预测方法,其特征在于,将原子空间表征与原子构成表征通过多层卷积神经网络,得到分子各级的表征具体为:
其中,为卷积层第I+1层的边表征,为卷积层第I+1层的原子表征;he与hv为更新函数;dij为第i个原子与第j个原子之间的距离张量,eij为第i个原子与第j个原子之间的边表征;第i个原子第I层的表征;第j个原子第I层的表征。
4.根据权利要求3所述的分子属性预测方法,其特征在于,
其中,η为超参数,为元素乘法,为元素加法,Wue为权重矩阵;σ为tanh激活函数,Wuv为权重矩阵,Mfa、Mfd与Mfe为全连接层。
5.根据权利要求4所述的分子属性预测方法,其特征在于,所述步骤S2)中将分子各级的表征进行组合,具体为:
其中,为第i个原子第k层的表征;T为多层卷积神经网络中卷积层的层数。
6.根据权利要求5所述的分子属性预测方法,其特征在于,所述模型为:
其中,为预测值,σ′为softplus激活函数,为应用在原子构成表征上的权重矩阵;为应用在原子构成表征上的全连接层;为应用在边表征上的权重矩阵;为应用在边表征上的全连接层。
7.根据权利要求6所述的分子属性预测方法,其特征在于,得到模型后,还包括:用已有的分子属性数据训练模型中的参数。
8.根据权利要求1所述的分子属性预测方法,其特征在于,所述步骤S2)中多层卷积神经网络中卷积层的个数为4~5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811258268.X/1.html,转载请声明来源钻瓜专利网。





