[发明专利]一种基于残基特征距离的蛋白质结构预测方法有效
申请号: | 201810986237.X | 申请日: | 2018-08-28 |
公开(公告)号: | CN109360600B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 张贵军;王小奇;谢腾宇;马来发;周晓根;胡俊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 残基 特征 距离 蛋白质 结构 预测 方法 | ||
一种基于残基特征距离的蛋白质结构预测方法。首先,计算出先验知识中目标蛋白的初始残基特征距离与目标构象的特征距离误差,并将这些距离误差作为采样范围的适应度;然后,根据轮盘机制选择出适应度较高的残基范围作为有效的采样区域;最后,Manhattan距离与能量函数作为打分函数来指导种群的更新,进而选出潜在的构象。本发明提出一种采样效率较高、预测精度较高、计算代价低的基于残基特征距离的蛋白质结构预测方法。
技术领域
本发明涉及一种生物学信息学、人工智能优化、计算机应用领域,尤其涉及的是一种基于残基特征距离的蛋白质结构预测方法。
背景技术
蛋白质是维持生命活动、功能最多的生物单元,而蛋白质的生物功能由蛋白质的三级结构决定,因此通过一维序列来预测蛋白质的三级结构是生物信息领域主要研究的方向之一。蛋白质结构预测方法主要有两种途径:实验法和理论预测。虽然实验法可以准确预测某些特定的蛋白质结构,但由于预测费用过于昂贵、预测时间太长的缺点极大限制了实验预测方法的广发应用,因此理论预测方法的研究显得尤为重要。理论预测方法通常可以分为同源建模、穿线法、从头预测等三类;其中同源建模、穿线法不同程度的依赖于已知结构的模板,而从头预测法是从蛋白质序列出发,不需要任何已知的结构,而是以第一性原理构建蛋白质折叠力场,再通过相应的构象搜索方法,进而预测出目标蛋白质的三维结构。
尽管从头预测法对“第二遗传密码”的探索有非凡的意义,但随着氨基酸序列的增长,构象空间变的极其复杂,局部最小能量值的也随之增加,这就要求必须选择有效的搜索算法才能找到接近天然态的结构。为了解决该问题大量的研究者提出使用遗传算法、改进的禁忌搜索算法、模拟退火算法以及,遗传算法与模拟退火算法相结合的方法等优化方法,然而,这些方法运行时间长、效率低,具有一定的局限性。
因此,现有的构象空间搜索方法在预测精度和采样效率方面存在着缺陷,需要改进。
发明内容
为了克服现有的蛋白质结构预测构象空间搜索方法存在采样效率较低、预测精度较低的不足,本发明提出一种采样效率较高、预测精度较高的基于残基特征距离的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于残基特征距离的蛋白质结构预测方法,所述方法包括以下步骤:
1)给定输入序列信息;
2)根据QUARK获得目标蛋白的初始残基特征距离集V={vk,k+n|k∈[1,L-n]},其中vk,k+n是目标蛋白中第k个残基的Cα原子和第k+n个残基的Cα原子之间的距离,L是序列长度,残基的片段长度n;
3)参数初始化:设置构象集规模NP,初始构象中采样次数iter,迭代计数器co,最大搜索迭代次数Cmax,概率参数p;
4)初始化构象集:启动NP条Monte Carlo轨迹,每条轨迹搜索iter次,即生成NP个初始构象;
5)对每个目标构象xi,i∈{1,...,NP}进行如下操作:
5.1)构建轮盘赌采样机制,过程如下:
5.1.1)依次计算出目标构象xi的第k个氨基酸的Cα原子和第k+n个氨基酸的Cα原子之间的欧式距离进而构建残基特征距离集
5.1.2)构建残基距离集Vi与初始特征集V对应元素间的差值构成的特征距离误差集
5.1.3)根据计算每个残基对被选中的概率作为适应度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810986237.X/2.html,转载请声明来源钻瓜专利网。