[发明专利]一种基于图神经网络的共晶预测方法、深度学习框架有效
申请号: | 202010778523.4 | 申请日: | 2020-08-05 |
公开(公告)号: | CN111882044B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 蒲雪梅;江源远;袁榕澳;李洪珍;刘建;徐涛 | 申请(专利权)人: | 四川大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 刘妮 |
地址: | 610064 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 预测 方法 深度 学习 框架 | ||
本发明属于共晶体形成预测技术领域,公开了一种基于图神经网络的共晶预测方法、深度学习框架,包括:共晶样本收集;数据处理;数据集划分;引入迁移学习的计算策略,提出用于共晶筛选的图神经网络网框架CCGNet,并在CCGNet框架下构建共晶的预测模型,进行共晶筛选。本发明构建的深度学习框架CCGNet建立的模型的预测性能大幅超越了传统的机器学习模型和经典的图神经网络模型,为共晶筛选提供了一种高通量和高准确率的解决方案,丰富了共晶工程的方法论,向实现数据驱动的共晶工程设计迈出了重要的一步。本发明还收集了大量可靠的共晶数据,为以后基于机器学习的共晶筛选工作提供了有力的数据支撑。
技术领域
本发明属于共晶体形成预测技术领域,尤其涉及一种基于图神经网络的共晶预测方法、深度学习框架。
背景技术
目前,共晶已成为改善材料性能的一种有效途径,然而只通过实验手段来筛选共晶体时效慢、成本高。人工智能技术的发展为共晶体的筛选提供了另外途径,具有快速和成本低的优势。然而,目前没有大量且有代表性的共晶数据集,限制了深度学习方法在此领域应用的可靠性。因此,如何针对共晶样本量少的特点,利用机器学习算法去构建可靠的预测模型成为其使用的一个关键问题。
图神经网络是一种针对图结构数据的深度学习方法。将原子作为节点,共价键作为边对有机分子是一种很自然的表征方式。GNN已经在药物发现,晶体预测,量子化学等领域有了应用。对比经典的分子特征化算法,如ECFP指纹,分子描述符;图神经网络的特征提取策略是可学习的,意味着对特征提取策略进行修饰可以进一步提高模型性能。
通过上述分析,现有技术存在的问题及缺陷为:
(1)现有只通过实验手段来筛选含能共晶体时效慢、成本高。
(2)目前缺乏有代表性的共晶数据集,限制了机器学习方法在此领域应用的可靠性。
解决以上问题及缺陷的难度为:受数据集和算法的制约,目前文献报道机器学习模型预测准确率较低,最高只有85%左右,不具有实用价值。
解决以上问题及缺陷的意义为:通过文献和数据库的筛选收集到有代表性且足够支撑深度学习模型训练样本集。本发明通过样本表征和模型算法的改进极大地提高了机器学习模型预测共晶的准确率,达到了96%+。从而具有了实用价值,可以减少共晶筛选实验的成本,提高共晶筛选的效率。
发明内容
针对现有技术存在的问题,本发明提供了一种基于图神经网络的共晶预测方法、深度学习框架。
本发明是这样实现的,一种基于图神经网络的共晶预测方法,所述基于图神经网络的共晶预测方法包括以下步骤:
步骤一,共晶样本收集:将具有长程和短程有序性的cocrystal定义为共晶正样本,将不具有长程有序性的固体eutectic和其他形式的固体作为负样本。
步骤二,数据处理:将分子表示成图,将两个分子图组合表示共晶样本,成为共晶图;同时挑选描述分子整体信息的描述符作为全局状态输入模型。
步骤三,数据集划分:共晶数据集划分10%做独立验证集,剩下的样本做十倍交叉验证;含能共晶数据集同样划分10%做独立验证集,剩下的样本则做5倍交叉验证。
步骤四,引入迁移学习的计算策略,提出用于共晶筛选的图神经网络网框架CCGNet,并在CCGNet框架下构建药物共晶的预测模型,进行共晶筛选。
进一步,步骤一中,所述共晶正样本从剑桥数据库CCDC中筛选6829个,负样本从文献中收集1052个;所述含能共晶正样本收集151个;负样本来自九院实验结果以及FOX-7,RDX,EDTH,NTO与其他含能分子的组合,总共得到负样本843个。
进一步,所述正样本的筛选满足以下条件:
1)必须包含两个不同的分子;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010778523.4/2.html,转载请声明来源钻瓜专利网。