[发明专利]基于深度学习方法预测化合物蛋白质相互作用的新型深度模型、计算机设备、存储介质在审
| 申请号: | 202011499748.2 | 申请日: | 2020-12-18 |
| 公开(公告)号: | CN112530514A | 公开(公告)日: | 2021-03-19 |
| 发明(设计)人: | 王淑栋;刘嘉丽;宋弢;田庆雨 | 申请(专利权)人: | 中国石油大学(华东) |
| 主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00;G16C20/30;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 266580 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习方法 预测 化合物 蛋白质 相互作用 新型 模型 计算机 设备 存储 介质 | ||
本发明公开了一种基于深度学习方法预测化合物蛋白质相互作用的新型深度模型。所述的新型深度模型包括三个双向门控循环单元(BiGRU)模型、图卷积神经网络模型(GCN)和卷积神经网络(CNN)模型,整个网络架构为TripleBiGRU/GCN‑CNN。所述的双向门控循环单元模型包括两个门控循环单元(GRU)组成的序列处理模型,一个输入是向前输入,另一个输入是反向输入,是一个只有输入门和忘记门双向递归神经网络。模型的输入为化合物一维SMILES序列、化合物二维分子图、蛋白质结构属性序列和蛋白质氨基酸序列,四个变量分别输入到TripleBiGRU/GCN模型里。TripleBiGRU/GCN模型输出为表示化合物的特征向量和表示蛋白质的特征向量。所述的CNN模型由卷积层、池化层、全连接层组成,该模型的输入为化合物的特征向量、蛋白质的特征向量;该TripleBiGRU/GCN‑CNN模型的最终输出为预测化合物蛋白质亲和力值的根均方误差值。
技术领域
本发明涉及化合物蛋白质分子特征提取领域,具体涉及一种基于深度学习方法预测化合物蛋白质相互作用的新型深度模型、计算机设备、存储介质。
背景技术
药物靶标相互作用预测对药物的设计和开发具有重要意义。虽然实验分析仍然是确定药物靶标相互作用最可靠的方法,但由于实验中涉及到的巨大成本和劳动力使得每个可能药物靶标的实验表征是令人生畏的。因此药物靶标的计算预测近年来取得了巨大的发展,随着近些年蛋白质结构数据集和配体数据集的增多,基于机器学习的方法取得快速发展。即将蛋白质信息、配体信息和相互作用整合到统一的框架内。
深度学习的引入被证明是预测药物靶点结合亲和力的最佳模型之一。深度学习的主要优点是通过在每一层中进行非线性转换,它们能够更好的表示原始数据进而便于学习数据中隐藏的模式。然而很多模型的化合物表示仅仅是分子指纹、单一的SMILES字符串。这样会使编码的化合物特征表示丢失许多化合物原有的重要信息,造成最终预测化合物蛋白质亲和力值的不准确性。
发明内容
本发明的目的是为了解决上述化合物分子和蛋白质分子重要信息丢失并提高预测准确率等问题,本发明实施例提供一种基于深度学习方法预测化合物蛋白质相互作用的新型深度模型、计算机设备、存储介质,将化合物分子的二维分子图结构信息和一维SMILES字符串信息结合起来,从而可以提取到更多关于化合物分子的信息,将蛋白质的结构属性序列信息和氨基酸序列信息结合起来获取更多关于蛋白质分子的信息,并且使用深度学习方法提高预测化合物蛋白质亲和力值的准确率。
根据本发明实施例的第一方面,提供了基于深度学习方法预测化合物蛋白质相互作用的新型深度模型。
在一些可选实施例中,所述的深度模型包括三个双向门控循环单元(BiGRU)模型、图卷积神经网络模型(GCN)和卷积神经网络(CNN)模型,整个网络架构为TripleBiGRU/GCN-CNN。所述的双向门控循环单元模型包括两个门控循环单元(GRU)组成的序列处理模型,一个输入是向前输入,另一个输入是反向输入,是一个只有输入门和忘记门双向递归神经网络。模型的输入为化合物一维SMILES序列、化合物二维分子图、蛋白质结构属性序列和蛋白质氨基酸序列,四个变量分别输入到TripleBiGRU/GCN模型里。TripleBiGRU/GCN模型输出为表示化合物的特征向量和表示蛋白质的特征向量。所述的CNN模型由卷积层、池化层、全连接层组成,该模型的输入为化合物的特征向量、蛋白质的特征向量;该TripleBiGRU/GCN-CNN模型的最终输出为预测化合物蛋白质亲和力值的根均方误差值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011499748.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于多种工况条件用组合型密封垫片
- 下一篇:循环蒸汽式环绕料理锅





