[发明专利]一种基于有偏采样的蛋白质结构预测方法有效
申请号: | 201810993749.9 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109300505B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 张贵军;王小奇;郝小虎;周晓根;马来发;胡俊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于有偏采样的蛋白质结构预测方法,在遗传算法的基本框架下,对每个目标个体进行基于二级结构的有偏交叉策略;然后,随机选择一个变异窗口,以每个片段的二级结构得分为适应值,利用轮盘赌的方式选择一个适应值较高的片段来替换构象中的片段信息;最后,以构象的结构属性为主,能量属性为辅共同来指导种群的更新,进而选出潜在的构象进入下一代种群。本发明提出一种预测精度高、计算代价低的基于有偏采样的蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 采样 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于有偏采样的蛋白质结构预测方法,其特征在于,所述方法包括以下步骤:1)给定输入序列信息;2)利用PSIPRED平台预测目标蛋白的二级结构信息,利用ROSETTA平台构建9片段的片段库;3)选取Rosetta score3能量函数E(x);4)参数初始化:设置种群规模Ps,迭代计数器g,最大遗传代数Gmax,初始种群搜索轨迹长度N,交叉片段长度c;5)初始化种群:启动Ps条Monte Carlo轨迹,每条轨迹搜索N次,即生成Ps个初始个体;6)对每个目标个体xi,i∈{i=1,.2..,Ps}进行如下操作:6.1)随机选择一个个体xj,j∈{1,2,...,Ps}且j≠i,进行交叉操作:6.1.1)产生一个随机整数r∈[1,l‑c],确定出交叉区域[r,c+r],其中l为序列长度;6.1.2)根据预测的二级结构知识,确定出目标蛋白在区域[r,c+r]中对应的二级结构Src={qk|r≤k≤r+c},其中,qk∈{H,E,L}是在目标蛋白中预测的第k氨基酸对应的二级结构类型;6.1.3)利用DSSP测定个体xi的二级结构,并确定出交叉区域对应的二级结构序列
其中,
是构象xi中第k个残基对应的二级结构类型;6.1.4)根据公式
计算个体xi中交叉片段的得分,其中,f(k)根据如下公式计算:
其中,pk代表在预测的二级结构知识中第k个氨基酸的二级结构被预测为qk的置信度;6.1.5)与步骤6.1.3)同理,确定出个体xj中区域[r,c+r]对应的二级结构序列
6.1.6)与步骤6.1.4)同理,计算个体xj中交叉片段的二级结构得分
6.1.7)比较
与
的大小,如果
则xi′=xi,并进入步骤6.2),否则,执行步骤6.1.8);6.1.8)用个体xj中[r,c+r]区域的扭转角度依次替换个体xi中对应区域的扭转角,生成交叉个体xi′;6.2)对个体x′i进行如下的变异操作:6.2.1)随机产生一个整数u∈[1,l‑9],进而确定出个体x′i的片段插入窗口[u,9+u]以及片段库中对应的片段
其中h是片段库中对每一个片段的编号;6.2.2)根据片段库中的信息确定出在第u个位置处,每个片段
的二级结构
其中,
是片段库中第h个片段的第t个氨基酸对应的二级结构类型;6.2.3)与步骤6.1.4)同理计算得到在第u个位置处,片段库中每个片段
的二级结构得分
6.2.4)根据公式
计算在第u个位置处每个片段的适应值;6.2.5)以
为每个片段的适应值,利用轮盘赌的方式随机选取一个片段,并用该片段的扭转角替换个体x′i中的扭转角,生成变异分体x″i;6.3)根据能量和二级结构得分进行如下的选择操作:6.3.1)利用DSSP分别测定出个体xi和x″i的二级结构序列
和
6.3.2)与步骤6.1.4)同理,分别计算个体xi和x″i的二级结构得分ssi和ss″i;6.3.3)比较ssi和ss″i的大小,如果ssi<ss″i,则变异个体x″i换个体xi,并作为下一代的目标个体,执行步骤7),否则执行步骤6.3.4)和步骤6.3.5);6.3.4)根据Rosetta score3函数分别计算个体xi和x″i的能量E(xi)和E(x″i);6.3.5)比较E(xi)和E(x″i)的大小,如果E(x″i)<E(xi),则变异个体x″i换个体xi,并作为下一代的目标个体,执行步骤7),否则个体xi被保留,并作为下一代的目标个体,执行步骤7);7)对种群中的每一个个体都执行完步骤6)以后,迭代次数g=g+1,判断g是否大于Gmax,若g>Gmax,则停止迭代并退出,否则返回步骤6)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810993749.9/,转载请声明来源钻瓜专利网。