[发明专利]一种基于双层偏置搜索的蛋白质结构预测方法有效
申请号: | 201910743322.8 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110634531B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张贵军;夏瑜豪;赵凯龙;刘俊;彭春祥;周晓根 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B50/30 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双层 偏置 搜索 蛋白质 结构 预测 方法 | ||
一种基于双层偏置搜索的蛋白质结构预测方法,在遗传算法框架下,首先,种群初始化,根据构象的能量高低将其分配到不同的能量区间;然后,根据能量以及空间结构差异性双层选择指标有偏地选择父代和淘汰构象,不仅能够缓解能量函数不精确的问题,而且可以根据有偏采样搜索到结构更为合理的构象,在提高采样效率的同时,提升了预测精度。本发明提供一种预测精度较高的基于双层偏置搜索的蛋白质结构预测方法。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于双层偏置搜索的蛋白质结构预测方法。
背景技术
蛋白质分子是细胞中许多生化过程的核心。蛋白质只有折叠成特定的三维结构才能行使其生物学功能。因此,要了解蛋白质的功能,就必须获得其三维结构。由此,人们开始了对蛋白质三维结构的不断探索。
近几年来,测定蛋白质的三维结构主要采用生物湿实验的方法,例如:X射线衍射、核磁共振、冷冻电镜。但是,这些实验方法需要花费大量的人力、物力、财力,而且测定的速度远远跟不上序列获取的速度。因此,急需一种高效、快速、简便的方法对未知蛋白质进行结构预测。并且,Anfinsen在1961年提出,蛋白质链中氨基酸的序列决定了其具有生物活性的空间排列。因此,人们提出了一种利用计算机技术根据蛋白质的氨基酸序列预测蛋白质三维结构的方法。根据氨基酸序列预测蛋白质三维结构的方法主要有同源建模法和从头预测法。从头预测方法直接基于蛋白质的物理或知识能量模型,利用优化算法在构象空间中搜索全局最优解。
但是,蛋白质的构象空间极其庞大且复杂,现有的方法往往存在两大缺陷:一方面由于能量函数不精确,导致无法准确地找到令人满意的结果;另一方面在于目前的优化方法采样能力不足,极其容易陷入局部极小值,从而影响整体的预测精度。
因此,现有的蛋白质结构预测方法存在能量函数不精确、采样效率低、预测精度不足等问题,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法采样效率低、种群多样性差、预测精度不足等问题,本发明提供一种基于双层偏置搜索的蛋白质结构预测方法,在基本遗传算法框架下,利用能量和空间结构差异性构成的双层搜索策略,对构象进行有偏搜索及排挤,从而提高了采样效率,增加了种群多样性,改善了整体的预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于双层偏置搜索的蛋白质结构预测方法,所述方法包括以下步骤:
1)输入目标蛋白质的序列信息;
2)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件;
3)设置参数:种群规模NP,最大迭代次数G,能量区间划分个数M,温度因子β;
4)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群C={C1,C2,...,CNP},其中Ci,i=1,2,...,NP为第i个个体;
5)设置g=1,g∈{1,2,...,G};
6)设置n=1,n∈{1,2,...,NP};
7)记Ci′为种群中第i′个个体,i′∈{1,2,...,NP+n-1},并进行如下操作:
7.1)用Rosetta score3能量函数计算种群中每个个体的能量,个体Ci′的能量为score3(Ci′);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910743322.8/2.html,转载请声明来源钻瓜专利网。