[发明专利]一种基于特定距离约束的蛋白质结构预测方法有效
申请号: | 201810994671.2 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109300506B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 张贵军;马来发;王小奇;周晓根;王柳静;胡俊 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B50/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于特定距离约束的蛋白质结构预测方法,首先利用MetaPSICOV预测查询序列的残基间距离接触信息,构建片段库;其次建立基于特定距离约束的打分函数,设计交叉变异策略;最后根据残基间距离约束分值和概率值实现种群更新,利用残基间距离约束能够有效地提高算法采样能力、搜索效率,进而得到结构更加紧凑、能量更低的构象。本发明提供一种预测精度较高的基于特定距离约束的蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 特定 距离 约束 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于特定距离约束的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)输入查询序列,利用MetaPSICOV预测查询序列的残基间距离接触信息,利用Robetta构建查询序列的片段库;2)根据两个残基间属于接触的置信度,对预测的残基间距离接触信息按从大到小排序,选前L个残基间距离接触,其中L是查询序列长度;3)设置初始种群规模NP、最大迭代次数Gen、交叉概率CR、片段组装次数N,输入查询序列、片段库、残基间接触信息和迭代次数g=0;4)初始化种群,对种群中每个构象Ci进行N次片段组装,其中i∈[1,NP]是种群中构象索引值;5)构象交叉,操作如下:5.1)选择第i个构象Ci为目标构象,产生一个随机数r,r∈[0,1],如果r小于CR,则继续步骤5.2),否则跳至步骤6);5.2)随机选择一个构象Cj,j≠i,利用计算二级结构算法DSSP获取构象Ci的二级结构信息;5.3)根据Ci残基位置随机选择一个交叉点p,判断交叉点p对应的残基的二级结构类型S,S∈{H,E,L},H、E和L分别代表螺旋、片层、无规则折叠;5.4)针对Ci和Cj,从交叉点p开始依次互换二面角对直到另一个交叉点处残基的二级结构S′≠S,S′∈{H,E,L},产生两个新构象C′i和C″j;6)构象变异,对构象C′i和C′j,变异过程如下:6.1)对构象C′i和C′j进行9残基片段组装,生成两个构象C″i和C″j;6.2)分别对构象C″i和C″j求残基间距离约束分值Eco:
其中N是残基接触总数,
是查询序列中第k个残基对p和q被预测为有接触的置信度,
是测试构象的第k个残基对p和q之间的碳β距离,dcon是预测为接触的阈值,
6.3)从构象C″i和C″j中选择残基间距离约束分值E′co最高的构象作为变异成功构象;7)基于特定距离约束进行选择,过程如下:7.1)对种群中的每个构象求残基间距离约束分值Eco,并求出最小的残基间距离约束分值E″co;7.2)如果E′co大于E″co,则用E′co对应的构象替换E″co对应的构象实现种群更新,跳到8),否则根据E′co和E″co计算接受概率pcon:
其中n是被预测为接触但在实际构象中残基间距离大于
的残基对总数,KTcon为温度因子;7.3)产生一个随机数r′,r′∈[0,1],如果r′小于pcon,则用E′co对应的构象替换E″co对应的构象实现种群更新;8)g=g+1,判断是否达到最大迭代次数Gen,若不满足条件终止条件,则遍历种群执行步骤5),否则输出最后预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810994671.2/,转载请声明来源钻瓜专利网。