[发明专利]一种基于残基接触信息自学习的蛋白质结构预测方法有效
申请号: | 201810986060.3 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109215732B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 张贵军;谢腾宇;马来发;周晓根;王柳静;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 残基 接触 信息 自学习 蛋白质 结构 预测 方法 | ||
一种基于残基接触信息自学习的蛋白质结构预测方法,首先,利用Robetta和RaptorX‑Contact得到片段库和接触图;其次,在种群进化第一阶段进行残基对距离分布的学习并建立信息熵指标反映种群的收敛程度,达到自主学习的目的;然后,在最后种群进化第二阶段,利用学习到的残基对距离分布信息建立评分函数,辅助能量函数进行构象空间搜索;最后,通过聚类得到最终预测结果。本发明提供一种蛋白质结构预测方法,一方面可以自主学习残基对距离信息,辅助能量函数进行构象空间优化;另一方面,构建信息熵指标,实现两阶段的动态切换。
技术领域
本发明涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是一种基于残基接触信息自学习的蛋白质结构预测方法。
背景技术
蛋白质是由氨基酸以“脱水缩合”的方式组成的多肽链经过盘曲折叠形成的具有一定特定空间结构的生物大分子,从而在生物体中发挥某一特定功能。蛋白质的三维结构在药物设计、蛋白质工程和生物技术中具有重要意义。目前数以百万的蛋白质序列被解析出来,然而大部分的蛋白质结构未知。因此,蛋白质结构预测是一个重要的研究问题。
蛋白质序列与结构之间的鸿沟主要原因是测序技术的快速发展和结构解析技术进步相对缓慢。蛋白质结构实验测定方法包括X射线晶体学、核磁共振光谱、和电子显微镜等,这些方法被广泛用于蛋白质结构测定。这些实验测定方法极其耗时,代价昂贵,而且容易发生错误。在理论和应用的双重驱动下,许多科学家利用计算机从氨基酸序列来预测蛋白质三维结构。根据Anfinsen原则,以计算机为工具,运用适当的算法,从氨基酸序列出发直接预测蛋白质的三维结构,成为当前生物信息学中一种主要的研究课题。而从头预测方法是针对没有全长同源模板的目标蛋白采用“从头”的方法建模。从现实意义来讲,该方法具有普遍性,对于序列相似度20%或寡肽(10个残基的小蛋白)来说,从头预测方法是唯一的选择。
残基接触图是蛋白质三维结构的简约表达,并具有旋转平移不变性。结合机器学习,利用已有的大量基因组序列知识,分析共同进化残基序列,从而有效重构蛋白质三维结构。目前,预测的蛋白质接触图被成功应用于预测膜蛋白。接触图可以捕获远程残基对的作用力,尤其是β二级结构中的氢键作用。
Rosetta在历届CASP赛事中表现突出,其提出Abinitio协议成为一种经典的基于片段组装的多阶段从头预测方法。此外,利用Monte Carlo算法对基于知识的能量函数进行优化,从而达到快速有效搜索构象空间的目的。然而该方法知识能量函数不能有效捕获残基间的远程作用力,并且在预测序列较长的目标蛋白时,固定代价下阶段切换容易导致“过采样”或者采样不充分影响预测精度的问题。
因此,现有的多阶段蛋白质结构预测方法在多阶段采样和预测精度方面存在着缺陷,需要改进。
发明内容
为了克服现有的多阶段蛋白质结构预测方法在多阶段采样和预测精度方面的不足,本发明提供一种自主学习接触信息、预测精度高的基于残基接触信息自学习的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于残基接触信息自学习的蛋白质结构预测方法,所述方法包括以下步骤:
1)给定输入序列信息,利用Robetta服务器获得该序列的片段库;
2)利用RaptorX-Contact预测该序列的接触图,获得N个残基对的接触情况,并将接触图中的第k个残基对间的接触,接触是指Cα-Cα欧氏距离小于接触概率表示为Pk,k∈{1,...,N};
3)初始化:种群规模NP,信息熵阈值α,种群第一阶段和第二阶段最大迭代次数分别为G1,G2,根据输入序列,执行Rosetta Abinitio协议的第一与第二阶段NP次,产生初始构象种群P={C1,C2,...,CNP},其中CNP表示第NP个个体,记当前代数g=0;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810986060.3/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置