[发明专利]一种多元接触信息的子种群策略蛋白质结构预测方法有效
| 申请号: | 201911197621.2 | 申请日: | 2019-11-29 |
| 公开(公告)号: | CN111180004B | 公开(公告)日: | 2021-08-03 |
| 发明(设计)人: | 张贵军;彭春祥;刘俊;周晓根;李亭 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G16B15/00 | 分类号: | G16B15/00 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多元 接触 信息 种群 策略 蛋白质 结构 预测 方法 | ||
一种多元接触信息的子种群策略蛋白质结构预测方法,在进化算法框架下,首先,利用片段组装技术初始化种群;然后,把种群分为多个子种群,对子种群中的每个个体进行变异,交叉操作产生新构象;在选择环节,首先利用Rosetta能量函数score3对新构象进行选择;然后,利用Scon(C)对能量低的新构象进行进一步的筛选,同时通过蒙特卡洛概率接收准则保持选择过程中构象的多样性。该方法利用子种群的概念并结合了多个contact服务器预测出的接触信息辅助结构预测,不仅能够缓解能量函数不精确的问题,而且可以提高种群的多样性。本发明提供一种多样性好、预测精度高的多元接触信息的子种群策略蛋白质结构预测方法。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种多元接触信息的子种群策略蛋白质结构预测方法。
背景技术
蛋白质结构预测是结构生物信息学的主要研究内容。2018年12月初,在墨西哥坎昆举行的全球蛋白质结构预测竞赛(CASP13)中,谷歌旗下的DeepMind团队研发的AlphaFold获得总分第一名。AlphaFold最具创新性以及突破的地方就是利用了机器学习的方法预测出蛋白质结构的空间距离关系,并且利用该空间距离约束作为能量函数指导蛋白质折叠,极大的提高了预测精度。该工作同时也表明了计算机技术、信息技术以及生命科学领域的深度交叉融合,将会有效的驱动和加速科学的新发现。然而,从头预测方法目前还面临着诸多困难和挑战。
第一,由于能量模型的不精确性,使得残基间接触信息的准确性成为目前制约蛋白质结构从头预测精度关键的因素之一。虽然,目前残基间接触信息预测的精度达到了一个前所未有的新时代,但接触信息的准确性还比较低,各个contact预测服务器预测出的接触信息都参差不齐,导致contact预测的准确性与蛋白质结构预测精度没有形成一个很好的对应关系。
第二,蛋白质构象空间优化的本质复杂性,使其成为蛋白质结构从头预测领域中一个极具挑战性的研究课题。为了能够利用计算机在巨大的采样空间中发现唯一的蛋白质天然结构,就必须设计高效的构象空间优化算法将其转化为可实际操作的计算问题。差分进化算法(DE)由于其结构简单,易于实现,鲁棒性强和收敛速度快等优点在蛋白质构象空间优化领域有着广泛的运用。然而,随着氨基酸序列的增长,蛋白质分子体系自由度也增大,在保证种群多样性的条件下利用传统群体算法采样获得大规模蛋白质构象空间的全局最优解成为一项挑战性的工作。
因此,现有的蛋白质结构预测方法在多样性和预测精度方面存在不足,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法在采样过程中多样性差和预测精度低问题,本发明首先利用多个contact预测服务器预测得到的接触信息,然后构建出高置信度接触集。同时利用子种群的概念,对于不同的子种群采用不同的空间约束模型辅助Rosettascore3能量函数来指导构象选择。本发明提出一种多样性好、预测精度高的多元接触信息的子种群策略蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种多元接触信息的子种群策略蛋白质结构预测方法,所述预测方法包括以下步骤:
1)给定目标蛋白的序列信息;
2)根据目标蛋白序列从ROBETTA服务器(http://www.robetta.org/)上得到片段库文件,其中包括3片段库文件和9片段库文件;
3)根据目标蛋白序列分别从RaptorX服务器(raptorx.uchicago.edu/ContactMap)、ResTriplet服务器(zhanglab.ccmb.med.umich.edu/ResTriplet)、DNCON2服务器(sysbio.rnet.missouri.edu/dncon2)预测得到3个接触图,根据每个接触图中每个接触信息的置信度的大小,由大到小选择L/5个接触信息分别形成高置信度接触信息集contactf1、contactf2和contacf3,其中L为目标蛋白质序列的长度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911197621.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





