[发明专利]一种基于深度强化学习的含能化合物分子结构生成方法在审
| 申请号: | 202110805227.3 | 申请日: | 2021-07-16 |
| 公开(公告)号: | CN113707233A | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 徐作英;马文斌;石彦超;林宏;张鹤;杨冠卓 | 申请(专利权)人: | 内蒙合成化工研究所 |
| 主分类号: | G16C20/20 | 分类号: | G16C20/20;G16C20/70;G16C20/90;G06N3/08;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 010076 内蒙*** | 国省代码: | 内蒙古;15 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 强化 学习 化合物 分子结构 生成 方法 | ||
1.一种基于深度强化学习的含能化合物分子结构生成方法,其特征在于,包括如下步骤:
S1:建立含能化合物和类含能化合物的SMILES分子结构数据集并生成分子结构词汇表,通过调用分子结构字典对SMILES分子结构进行分词器编码,将SMILES分子结构编码成数字序列;
S2:将编码后的类含能化合物数字序列化的分子结构通过循环神经网络进行深度学习,调节超参数得到优化的深度学习预训练模型;
S3:调用数字序列化的类含能化合物分子结构与深度学习预训练模型进入循环神经网络进行强化学习,调节超参数得到优化的深度强化学习模型;
S4:调用深度强化学习模型,调节超参数控制指纹相似度生成新型含能化合物分子结构,通过分子结构标准化得到结构正确的分子结构,并进行模型效果评价。
2.根据权利要求1所述的基于深度强化学习的含能化合物分子结构生成方法,其特征在于,所述S1中SMILES分子结构由表示元素、键与连接关系的字母组成;所述分子结构词汇表是结合SMILES分子结构数据集与SMILES分子结构编码规则生成,分子结构词汇表由35个Tokenizer字符组成,调用Tokenizer函数将SMILES分子结构转化为数字序列的分子结构;所述类含能化合物数字序列化的分子结构长度为136,确保含能化合物和类含能化合物的SMILES分子结构数字化序列的唯一性。
3.根据权利要求1所述的基于深度强化学习的含能化合物分子结构生成方法,其特征在于:所述S2包括如下步骤:
S21:将类含能化合物经数字化序列的分子结构数据集分批次输入循环神经网络进行训练;
S22:调整每批次训练的超参数,保留每批次交叉熵损失函数曲线到达平稳状态的模型后作为深度学习预训练模型。
4.根据权利要求1所述的基于深度强化学习的含能化合物分子结构生成方法,其特征在于:所述S3包括如下步骤:
S31:将类含能化合物经数字化序列的分子结构数据集和深度学习预训练模型输入循环神经网络;
S32:调整每次训练的超参数,调整每批次训练的超参数,保留每批次交叉熵损失函数曲线到达平稳状态的模型后作为深度强化学习模型。
5.根据权利要求1所述的基于深度强化学习的含能化合物分子结构生成方法,其特征在于:所述S4包括如下步骤:
S41:运行强化学习训练模型,批量生成数字序列的分子数据;
S42:对批量生成的数字序列数据依次进行数据解码和分子数据标准化;
S43:对标准化后的分子数据,过滤无效分子和去除重复分子;
S44:当生成的分子数量达到预先设定的分子数量时,保存生成的分子结构数据。
6.根据权利要求1所述的基于深度强化学习的含能化合物分子结构生成方法,其特征在于:所述循环神经网络包括嵌入层、门控循环单元、密集连接层和激活函数;类含能化合物数字序列化作为嵌入层的输入,嵌入层的输出作为门控循环单元层的输入,门控循环单元层的输出作为密集连接层的输入,密集连接层的输出作为激活函数的输入,其中嵌入层、门控循环单元层、密集连接层和激活函数依次循环执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙合成化工研究所,未经内蒙合成化工研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110805227.3/1.html,转载请声明来源钻瓜专利网。





