[发明专利]一种基于分子对接的虚拟药物筛选方法和装置在审
| 申请号: | 201911363012.X | 申请日: | 2019-12-26 |
| 公开(公告)号: | CN111199779A | 公开(公告)日: | 2020-05-26 |
| 发明(设计)人: | 刘玉海;尚嵩;任晓伟;宋怀明;蒋丹东;郭庆 | 申请(专利权)人: | 中科曙光国际信息产业有限公司 |
| 主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70;G06N3/04 |
| 代理公司: | 北京德恒律治知识产权代理有限公司 11409 | 代理人: | 章社杲;卢军峰 |
| 地址: | 266101 山东省青岛市*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 分子 对接 虚拟 药物 筛选 方法 装置 | ||
本发明提供了一种基于分子对接的虚拟药物筛选方法和装置,该方法包括:输入药物分子信息;将药物分子信息转化为n维度的浮点型数据信息;采用LSTM网络根据n维度的浮点型数据信息输出药物分子的每个原子的信息,从每个原子的信息中汇总得到表示药物分子特征的矢量;通过注意力网络为表示药物分子特征的矢量赋予权重,得到药物分子的矢量模型;根据矢量模型对药物分子的活性进行筛选。本发明的方案可以实现AUC值提升2%,并且有更强的鲁棒性。
技术领域
本发明涉及一种基于分子对接的虚拟药物筛选方法和装置。
背景技术
新药研发是一项非常耗时费力,成本巨大的工程。近年来,计算机辅助的虚拟药物筛选技术得到广泛得发展,其中一种被广泛应用的技术就是基于分子对接原理的虚拟药物筛选。分子对接技术的基本原理就是选取潜在的药物分子模拟结合病原靶点蛋白,但是每一种药物分子结合方式就可能有数千种,能够准确评价不同结合方式的数学函数更加难以获得。这是目前分子对接技术的核心问题。
随着近年来基于机器学习的算法在解决这方面问题获得较大的成功,如支持向量机,随机森林等,使得传统的机器学习技术能够一定程度上提高分子对接模型的性能,但是依靠人为去提取分子特征,明显限制了该类方法的广泛应用。此外,在一些实际的复杂问题上用该类方法获取的特征并不具备可解释性,模型的泛化性较差。
另一方面,机器学习的另一分支深度学习,逐渐被应用于该领域。该方法可以自动的直接从分子表达式中提取特征,用该方法建好的模型更容易迁移。在2014年,出现通过建立多任务神经网络,然后根据分子结构预测其生物化学活性的技术。紧接着在2015年,又出现了根据分子指纹图谱预测药物活性的技术。
目前深度学习算法在基于分子对接的虚拟筛选应用较少,更多的应用于对传统机器模型的优化,并且需要领域专家参与进行特征工程,特征工程好坏决定了模型质量。这就限制了该类算法的广泛应用,另外该类算法对不同分子对接质量的输出模拟效果很不稳定。
发明内容
针对相关技术中存在的问题,本发明的目的在于提供一种基于分子对接的虚拟药物筛选方法和装置,本发明的方案省略了人力参与的特征工程建设,利用Embedding(嵌入)方法将结构信息扩展成n维度矢量,通过LSTM网络和注意力机制自动提取特征。与最新算法在同一训练集上进行了结果对比,算法AUC值提升2%,并且在40种不同病原蛋白的训练集上有更强鲁棒性。
根据本发明的实施例,一种基于分子对接的虚拟药物筛选方法,包括:输入药物分子信息;将药物分子信息转化为n维度的浮点型数据信息;采用LSTM网络根据n维度的浮点型数据信息输出药物分子的每个原子的信息,从每个原子的信息中汇总得到表示药物分子特征的矢量;通过注意力网络为表示药物分子特征的矢量赋予权重,得到药物分子的矢量模型;根据矢量模型对药物分子的活性进行筛选。
根据本发明的实施例,基于分子对接的虚拟药物筛选方法,药物分子信息包括:原子类型、化学键能大小、原子间距和结合氨基酸类型。
根据本发明的实施例,基于分子对接的虚拟药物筛选方法,包括:在输入LSTM网络前对药物分子信息的数据序列进行填充,以保证批次数据序列长度一致。
根据本发明的实施例,基于分子对接的虚拟药物筛选方法,包括:对于任意药物分子x,由m个原子组成,输入LSTM的矩阵表示为{z1,z2,·····,zm},其中zi为第i个原子的信息矢量,则每个原子的经过网络的输出为:
ui=f(Wizi+bi),
f()为所述LSTM网络的输出函数。
根据本发明的实施例,基于分子对接的虚拟药物筛选方法,从每个原子的信息中汇总得到表示药物分子特征的矢量包括:采用最大值池化的方法,产生最终特征,具体公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科曙光国际信息产业有限公司,未经中科曙光国际信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911363012.X/2.html,转载请声明来源钻瓜专利网。





