[发明专利]基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质在审
申请号: | 202011499680.8 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112582020A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 王淑栋;刘嘉丽;宋弢;杜珍珍 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00;G16C20/30;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 边缘 注意力 机制 预测 化合物 蛋白质 亲和力 方法 计算机 设备 存储 介质 | ||
本发明公开了一种基于边缘注意力机制的预测化合物蛋白质亲和力方法。所述方法包括双向门控循环单元(BiGRU)模型和卷积神经网络(CNN)模型,整个网络架构为BiGRU/BiGRU‑CNN,其中BiGRU/BiGRU模型中加入了边缘注意力机制(Marginalized_Attention)。模型的输入为化合物序列与蛋白质序列,二者输入到BiGRU/BiGRU模型里。其中化合物序列表示为加入化合物分子理化性质的SMILES字符串称为SMILES#,蛋白质序列表示由蛋白质的结构属性编码而成。BiGRU/BiGRU输出为经过边缘注意力模型表示的化合物特征向量和蛋白质特征向量。所述的CNN模型由卷积层、池化层、全连接层组成,该模型的输入为化合物特征向量、蛋白质特征向量;该BiGRU/BiGRU‑CNN模型的最终输出为预测化合物蛋白质亲和力值的根均方误差值。
技术领域
本发明涉及化合物蛋白质分子结构与性质领域,具体涉及一种基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质。
背景技术
识别化合物蛋白质相互作用对识别关键化合物具有重要意义。传统的虚拟筛选方法如基于结构的虚拟筛选和基于配体的虚拟筛选在药物发现方面已经进行了十几年的研究并取得了巨大的成功。然而在蛋白质的三维结构未知或已知配体数据集太少的情况下,传统的虚拟筛选方法并不适用。之后有研究者引入了化学基因组学新观点,可以在不考虑蛋白质三维结构的情况下识别化合物蛋白质相互作用。此后各种机器学习算法被提出,在统一模型中同时考虑化合物信息和蛋白质信息。
随着深度学习的快速发展,许多类型的端到端框架被用于化合物蛋白质研究。与传统的机器学习算法相比,端到端学习在统一架构下将表示学习和模型训练结合在一起,建模前不需要定义和计算描述符。深度学习的引入被证明是预测药物靶点结合亲和力的最佳模型之一。深度学习的主要优点是通过在每一层中进行非线性转换,它们能够更好的表示原始数据进而便于学习数据中隐藏的模式。然而很多模型的化合物表示仅仅是分子指纹、单一的SMILES字符串。这样会使编码的化合物特征表示丢失许多化合物原有的重要信息,造成最终预测化合物蛋白质亲和力值的不准确性。
发明内容
本发明的目的是为了解决上述化合物分子重要信息丢失并提高预测准确率等问题,本发明实施例提供了一种基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质,能够将化合物分子的结构性质编码到SMILES字符串中,从而可以提取到更多关于化合物分子的信息,并且在化合物蛋白质特征表示过程中分别加入注意力模型即边缘注意力机制使得获取更精确的特征表示向量,并且使用深度学习方法提高预测化合物蛋白质亲和力值的准确率。
根据本发明实施例的第一方面,提供了基于边缘注意力机制的预测化合物蛋白质亲和力方法。
在一些可选实施例中,所述方法包括双向门控循环单元(BiGRU)模型和卷积神经网络(CNN)模型,整个网络架构为BiGRU/BiGRU-CNN,其中BiGRU/BiGRU模型中加入了边缘注意力机制(Marginalized_Attention)。所述的双向门控循环单元模型包括两个门控循环单元(GRU)组成的序列处理模型,一个输入是向前输入,另一个输入是反向输入,是一个只有输入门和忘记门双向递归神经网络。模型的输入为化合物序列与蛋白质序列,二者输入到BiGRU/BiGRU模型里。其中化合物序列表示为加入化合物分子理化性质的SMILES字符串称为SMILES#,蛋白质序列表示由蛋白质的结构属性编码而成。BiGRU/BiGRU输出为经过边缘的注意力模型表示的化合物特征向量和蛋白质特征向量。所述的CNN模型由卷积层、池化层、全连接层组成,该模型的输入为化合物特征向量、蛋白质特征向量;该BiGRU/BiGRU-CNN模型的最终输出为预测化合物蛋白质亲和力值的根均方误差值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011499680.8/2.html,转载请声明来源钻瓜专利网。