[发明专利]分子生成方法、装置、电子设备及存储介质在审
| 申请号: | 202010884581.5 | 申请日: | 2020-08-28 |
| 公开(公告)号: | CN112086144A | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 郑奕嘉;吴红艳;蔡云鹏;纪超杰 | 申请(专利权)人: | 深圳先进技术研究院 |
| 主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70 |
| 代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张瑞志 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分子 生成 方法 装置 电子设备 存储 介质 | ||
本申请适用于计算机技术领域,提供了分子生成方法、装置、电子设备及存储介质,分子生成方法包括:获取源分子数据,在d个时刻中,在每一个时刻分别将源分子数据和采样向量输入预设的分子生成模型中,输出与源分子数据对应的第一分子数据,其中,第r个时刻输入的采样向量是根据第r‑1个时刻输出的第一分子数据确定的,d≥r>1,r和d为整数,从而可以生成更优的采样向量,再根据更优的采样向量生成第一分子数据,可以得到性能更好的分子。
技术领域
本申请属于计算机技术领域,尤其涉及分子生成方法、装置、电子设备及存储介质。
背景技术
计算机辅助药物分子设计是一个新兴的结合了计算机、人工智能、药学、生物学的交叉领域,其中基于计算机的分子结构生成是一个重要的研究方向。现有的分子生成方法一般是先训练一个分子生成模型,将源分子数据输入训练好的分子生成模型,从而生成新的分子。为了提高生成分子的多样性,一般是将源分子数据和采样向量输入分子生成模型,生成新的分子,而采样向量一般是基于标准高斯分布进行多次采样得到的,因此,采样向量存在较大的随机性,会导致不能得到最优的采样向量,而根据随机性较大的采样向量生成分子时,会导致生成的分子的性能不满足要求。
发明内容
有鉴于此,本申请实施例提供了分子生成方法、装置、电子设备及存储介质,可以提高生成的分子的性能。
本申请实施例的第一方面提供了一种分子生成方法,包括:
获取源分子数据;
在d个时刻中,在每一个时刻分别将所述源分子数据和采样向量输入预设的分子生成模型中,输出与所述源分子数据对应的第一分子数据,其中,第r个时刻输入的所述采样向量是根据第r-1个时刻输出的所述第一分子数据确定的,d≥r>1,r和d为整数。
在第一方面的一种可能的实现方式中,根据第r-1个时刻输出的所述第一分子数据确定第r个时刻输入的所述采样向量的方法为:
将第r-1个时刻输出的所述第一分子数据输入预设的RNN模型中,得到第r个时刻对应的观测状态;
将所述第r个时刻对应的观测状态输入预设的智能体中,得到第r个时刻输入所述分子生成模型的所述采样向量。
在第一方面的一种可能的实现方式中,第1个时刻输入的所述采样向量是根据所述源分子数据确定的,其中,所述第1个时刻输入的所述采样向量的确定方法为:
将所述源分子数据输入所述RNN模型中,得到第1个时刻对应的观测状态;
将所述第1个时刻对应的观测状态输入所述智能体中,得到第1个时刻输入所述分子生成模型的所述采样向量。
在第一方面的一种可能的实现方式中,在所述将所述第r-1个时刻对应的观测状态输入预设的智能体中之前,所述方法还包括:
根据所述源分子数据和所述分子生成模型训练所述智能体。
在第一方面的一种可能的实现方式中,所述根据所述源分子数据和所述分子生成模型训练所述智能体,包括:
在d个时刻中,在每一个时刻根据输入分子数据和初始的智能体确定隐向量;
将所述源分子数据和所述隐向量分别输入所述分子生成模型中,输出与所述源分子数据对应的第二分子数据,其中,第r个时刻的输入分子数据是根据第r-1个时刻输出的所述第二分子数据确定的,第1个时刻的输入分子数据是所述源分子数据;
根据所述第二分子数据优化所述初始的智能体,得到用于输入所述观测状态的智能体。
在第一方面的一种可能的实现方式中,所述根据所述第二分子数据优化所述初始的智能体,包括:
根据所述第二分子数据的属性值、相似性以及差异性确定奖励值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010884581.5/2.html,转载请声明来源钻瓜专利网。





