[发明专利]一种基于图神经网络的单序列蛋白质接触图预测方法在审
申请号: | 202210950286.4 | 申请日: | 2022-08-09 |
公开(公告)号: | CN115312118A | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 欧阳建权;唐欢容;高涌露 | 申请(专利权)人: | 湘潭大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B30/00;G16B40/00;G06N3/04 |
代理公司: | 北京卓恒知识产权代理事务所(特殊普通合伙) 11394 | 代理人: | 徐楼 |
地址: | 41020*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 序列 蛋白质 接触 预测 方法 | ||
本发明属于蛋白质图谱预测领域,公开了一种基于图神经网络的单序列蛋白质接触图预测方法,包括以下步骤:收集蛋白质序列及对应的蛋白质三维结构数据,构建残基间接触矩阵;对每个蛋白质序列进行one‑hot编码处理,得到one‑hot一维特征;将每个蛋白质序列通过预训练模型得到一维蛋白质编码特征和二维注意力矩阵特征;构建图卷积编码模型和卷积解码模型;将one‑hot一维特征和预训练得到的一维蛋白质编码特征作为输入特征输入到图卷积编码模型得到蛋白质结构编码特征;将蛋白质结构编码特征和预训练得到的二维注意力矩阵输入到卷积编码模型中得到蛋白质序列中残基对接触预测矩阵。将本发明提供的方法生成的蛋白质接触图与真实接触图相似度高,预测精度好。
技术领域
本发明属于蛋白质图谱预测领域,特别涉及一种基于图神经网络的单序列蛋白质接触图预测方法。
背景技术
蛋白质是生命活动的主要承担者,行使着催化调节、免疫应答和细胞信号传导等众多重要生物学功能。由于蛋白质的生物学功能由特定的三维空间结构所决定,准确掌握蛋白质结构对了解蛋白质功能具有重要意义。如对于药物研发,疫苗治疗和研究生物功能等都有重要作用。目前蛋白质三维结构的获取主要分为实验测定和计算方法两种。实验测定方法可以准确获得蛋白质结构,但由时间长、成本高和难度大等缺点,如核磁共振法,冷冻电镜法等方法费时费力,实验器材和实验目标要求苛刻,价格昂贵,不利于大范围推广。而计算方法通过蛋白质序列对蛋白质结构进行预测,不仅可以显著节约时间,而且过程简单成本低。
在利用计算方法预测蛋白质结构过程中,蛋白质接触图预测是一个关键的中间步骤。蛋白质接触图是蛋白质结构的一种简化表现形式,包含了丰富的蛋白质结构信息,通过分析蛋白质接触图预测结果可以作为结构预测模型的限制条件来提高蛋白质结构的预测精度,以及蛋白质接触图预测结果来构建打分函数对结构预测模型进行评价和选择。即分析蛋白质接触图可得到蛋白质结构相关特征。
蛋白质接触的定义是当在一个蛋白质中当两个氨基酸在空间中的距离小于时,将认为该氨基酸对是相互接触的,从定义中可以看出蛋白质接触是可以给出蛋白质中各个氨基酸之间的空间距离,对于后续预测蛋白质的三维结构预测有着至关重要的作用。并且由于接触矩阵可以提供蛋白质的空间信息,在如蛋白质功能预测和蛋白质组相互作用等任务中提供蛋白质的结构信息。现有的蛋白质接触预测方法都是通过对目标蛋白质及其同源序列等同源信息来预测出每个氨基酸之间的共进化关系来推断氨基酸之间的接触概率。其中共进化关系可以简单理解为,在一个蛋白质中,两个或若干个氨基酸在空间上相互接近,共同形成蛋白质局部结构稳定,当其中一个或几个氨基酸发生变异导致局部结构发生变化,为了保持蛋白质结构稳定,这个局部结构中的其他氨基酸也会发生突变来维持蛋白质结构稳定,这种两个或若干个氨基酸之间的“相互突变”的关系就是共进化关系。同源序列是在已知的蛋白质结构中,与目标蛋白质在结构上相似而序列上来自共同祖先的蛋白质序列就是目标蛋白质的同源序列。然而,在现在已知蛋白质序列中,有相当多的蛋白质序列是缺少同源序列的,对于这些蛋白质序列来说,现有的方法的效果都不太理想,测试精度仍然很低,所以急需一种新的基于单序列的蛋白质接触预测方法。
发明内容
本发明所要解决的问题是解决现有蛋白质接触预测方法对于低同源单序列蛋白质接触预测的精度低。
为解决上述问题,本发明供一种基于图神经网络的单序列蛋白质接触图预测方法,包括以下步骤:
S1收集蛋白质序列,并在PDB数据库中收集对应的蛋白质三维结构数据,构建残基间接触矩阵;
S2对所述的每个蛋白质序列进行one-hot编码处理,得到one-hot一维特征;
S3将所述的每个蛋白质序列通过预训练模型得到一维蛋白质编码特征和二维注意力矩阵特征;
S4构建图卷积编码模型和卷积解码模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210950286.4/2.html,转载请声明来源钻瓜专利网。