[发明专利]一种基于深度学习的蛋白质-配体结合位点预测方法有效
申请号: | 201910879922.7 | 申请日: | 2019-09-18 |
公开(公告)号: | CN110689920B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 夏春秋;杨旸;沈红斌 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B20/30;G16B40/00 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 俞磊 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 蛋白质 结合 预测 方法 | ||
本发明公开了一种基于深度学习的蛋白质‑配体结合位点预测算法,对于待预测的蛋白质,首先提取其序列特征和距离矩阵,然后将序列特征通过滑动窗口方法分配到每个残基上,然后将残基所对应的特征逐个输入到残差神经网络和混合神经网络中,并将残差神经网络和混合神经网络的输出结果输入到Logistic回归分类器中,最终结果即为蛋白质中每个残基对应的结合概率。本发明将经典的双向长短时记忆网络和残差神经网络进行了融合,融合后的网络可以同时处理异构的蛋白质序列和结构数据,并挖掘出了序列特征和结构特征的互补性。与现有方法相比,有着更高的预测精度,且针对不同配体的数据集都有着不错的泛化性能。
技术领域
本发明涉及蛋白质生物学与模式识别领域,具体地说,特别涉及到一种基于深度学习的蛋白质-配体结合位点预测方法。
背景技术
蛋白质与配体的相互作用在生物过程中起着重要的作用,例如信号的传导,翻译后修饰以及抗原-抗体的相互作用。此外,药物发现和设计也非常依赖于对蛋白质与配体相互作用的机制分析。对于蛋白质-配体相互作用背后机制的进一步探索,结合位点的识别是非常关键的一步。随着蛋白质设计技术的出现,将会由更多新的蛋白质出现,它们有着未发掘的性质和功能,因此对于快速、准确的结合位点识别工具的需要也变得更为迫切。目前有通过湿实验的方法来识别蛋白质的结合位点,其缺陷在于:费时且代价高昂。
根据配体类型的不同,蛋白质-配体相互作用可以分类为蛋白质-蛋白质相互作用,蛋白质-DNA/RNA相互作用以及蛋白质-小分子相互作用。现阶段,已经有不少基于序列信息(蛋白质一级结构)或结构信息(蛋白质三级结构)的计算方法可以对蛋白质-配体结合位点进行预测。
基于序列的方法可以对三维结构未知的蛋白质进行位点预测,其使用一些纯基于序列的特征例如进化信息和预测得到的二级结构。但是由于结合位点的位置主要由蛋白质的三级结构决定,所以基于序列的方法的预测精度相对较低。
基于结构的方法都需要蛋白质中每个原子的三维空间坐标作为输入,但它们遵循着不同的评价标准,例如POCKET假设结合位点更有可能位于蛋白质表面凹陷的区域,SITEHOUND使用能量函数来计算蛋白质与配体之间的力场,TM-SITE则是一种基于模板匹配的方法。
发明内容
本发明的目的在于针对现有技术中的预测算法精度不高的现状提供一种基于深度学习的蛋白质-配体结合位点预测方法,以解决现有技术中存在的问题。
本发明针对蛋白质-配体结合位点识别的应用场景,将深度学习技术与蛋白质结构的领域知识相融合,给出了一种精度更高的预测方法,也对其中的部分问题提出了有效解决方案,例如数据不平衡问题、三维结构之间配准存在困难等。
本发明所解决的技术问题可以采用以下技术方案来实现:
一种基于深度学习的蛋白质-配体结合位点预测方法,包括如下步骤:
步骤1)首先提取蛋白质结构数据集的序列特征,然后从蛋白质各残基的三维空间坐标计算出每个残基对之间的欧氏距离,并构建距离矩阵;最后利用滑动窗口方法对每个残基截取特征张量;
步骤2)将每个结合位点作为正样本,非结合位点作为负样本,使用随机下采样的方法从负样本中抽取一个子集与所有的正样本构建一个训练子集,重复多次后获得多个训练子集;在构建mini-batch时,对正样本作随机上采样;
步骤3)利用残差块构建残差神经网络,并在所述距离矩阵上进行训练;
步骤4)将建残差神经网络与双向长短时记忆网络通过全连接层进行整合,构建混合神经网络,并在所述序列特征和距离矩阵上进行训练;
步骤5)根据所述残差神经网络和混合神经网络的输出结果训练一个Logistic回归分类器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910879922.7/2.html,转载请声明来源钻瓜专利网。