[发明专利]一种基于图神经网络的共晶预测方法、深度学习框架有效
申请号: | 202010778523.4 | 申请日: | 2020-08-05 |
公开(公告)号: | CN111882044B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 蒲雪梅;江源远;袁榕澳;李洪珍;刘建;徐涛 | 申请(专利权)人: | 四川大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 刘妮 |
地址: | 610064 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 预测 方法 深度 学习 框架 | ||
1.一种基于图神经网络的共晶预测方法,其特征在于,所述基于图神经网络的共晶预测方法包括:
共晶样本收集:将具有长程和短程有序性的cocrystal定义为共晶正样本,将不具有长程有序性的固体eutectic和其他形式的固体作为负样本;
数据处理:将分子表示成图,将两个分子图组合表示共晶样本,成为共晶图;同时挑选描述分子整体信息的描述符作为全局状态输入模型;
所述数据处理的方法包括:
(1)将分子表示成图:Graph=(E,V);E表示边的集合,V表示节点集合;节点代表原子,每个原子有对应的特征描述符;边表示共价键,每一条边也有对应的描述符;
(2)将两个分子图组合表示共晶样本,成为共晶图;因氢键和π-π堆积是分子间的主要相互作用;计算每个分子之间氢键受体和供体以及芳香原子;
(3)将分子1的氢键供体与分子2的氢键受体连接表示可能的氢键相互作用;同理,把分子1和分子2的芳香原子相连表示可能的π-π堆积;
(4)挑选描述分子整体信息的描述符作为全局状态输入模型;
数据集划分:共晶数据集划分10%做独立验证集,剩下的样本做十倍交叉验证;含能共晶数据集同样划分10%做独立验证集,剩下的样本则做5倍交叉验证;
引入迁移学习的计算策略,提出用于共晶筛选的图神经网络框架CCGNet,并在CCGNet框架下构建共晶的预测模型,进行共晶筛选;
所述用于共晶筛选的图神经网络网框架CCGNet的结构中,A,G,V分别表示样本的邻接张量,全局状态,节点特征;其中全局状态是指分子水平上的特征;CCGBlock是模型主要计算单元,用于变换节点、边以及全局状态;
所述CCGBlock主要有两个函数构成:Φg和Φv;Φg称作global state function,用来变换分子的全局状态,使用单层神经网络;Φv称作node update function用来更新节点特征,使用单层图卷积;
将最后一个CCGBlock输出的节点特征采用注意力机制生成表示整个共晶样本的嵌入向量;原始输入的全局状态G与这个嵌入向量连接得到最后表示整个共晶样本的特征向量,最后用ANN预测结果。
2.如权利要求1所述的基于图神经网络的共晶预测方法,其特征在于,所述共晶正样本从剑桥数据库CCDC中筛选6829个,负样本从文献中收集1052个;所述含能共晶正样本收集151个;负样本来自九院实验结果以及FOX-7,RDX,EDTH,NTO与其他含能分子的组合,总共得到负样本843个。
3.如权利要求2所述的基于图神经网络的共晶预测方法,其特征在于,所述正样本的筛选满足以下条件:
1)必须包含两个不同的分子;
2)排除常见的溶剂;
3)必须有3D结构且没有disorder原子;
4)单个分子量必须小于700;
5)只包含C,H,O,N,P,S,Cl,Br,I,F,Si;
6)必须是中性分子,排除盐;
7)排除只含C,H,O,N并且包含硝基的样本作为含能共晶正样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010778523.4/1.html,转载请声明来源钻瓜专利网。