[发明专利]一种蛋白质结构预测能量函数权重优化方法有效
申请号: | 201810994115.5 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109461470B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 周晓根;张贵军;彭春祥;刘俊;胡俊;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B20/00;G16B10/00;G06N3/12 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种蛋白质结构预测能量函数权重优化方法,首先,将所有能量项的权重设置为1,通过蛋白质结构预测方法利用待确定能量项权重的能量函数产生多个样本构象;然后,基于差分进化算法,将各能量项的权重值看作优化变量,以样本构象的能量值和均方根偏差之间的相关系数最大为目标,对各能量项权重值进行优化;最后,利用优化得到的权重值对应的能量函数对构象空间进行优化,以能量值最小的构象作为最终的预测结构。本发明提供一种能够得到合理能量项权重值的蛋白质结构预测能量函数权重优化方法。 | ||
搜索关键词: | 一种 蛋白质 结构 预测 能量 函数 权重 优化 方法 | ||
【主权项】:
1.一种蛋白质结构预测能量函数权重优化方法,其特征在于:所述方法包括以下步骤:1)给定需要确定权重的蛋白质能量函数E,以及各能量项E1,E2,...,EN,其中N为能量项的数量,En表示能量函数E的第n个能量项,n=1,2,...,N;2)参数设置:设置种群规模NP,交叉概率CR,步长因子F,蛋白质样本构象数量S,最大迭代次数Gmax,并初始化迭代次数g=0;3)将所有能量项的权重设置为1,运用该能量函数对应的蛋白质结构预测方法生成S个样本构象,并记录第s个样本的第n项能量项的值
s=1,2,...,S,n=1,2,...,N,以及该样本与天然态结构之间的均方根偏差Rs;4)将所有能量项权重组成的权重向量W=(W1,W2,...,WN)看作一个个体,其中Wn表示能量项En的权重,在(0,1]内随机生成NP个初始个体,组成初始种群
其中Wi,g,i=1,2,...,NP表示第g代种群中的第i个个体;5)计算每个个体Wi,g,i=1,2,...,NP的均方根偏差和能量的相关系数C(Wi,g):
其中
为根据第g代的第i个个体Wi,g对应的权重计算得到的第s个样本的能量值,
为Wi,g的第n维变量,
为所有样本均方根偏差的平均值,
为所有样本能量的平均值;6)对种群中的每个个体Wi,g,i∈{1,2,...,NP}执行如下操作:6.1)将个体Wi,g看作目标个体,根据相关系数对当前种群中的个体从大到小进行排序,并将排名靠前的NP/2的个体定为较优子种群,其余的为较差子种群;6.2)分别从较优子种群和较差子种群中的随机选择一个与目标个体不同的个体Wa,g和Wb,g,并从整个种群中随机一个与目标个体以及Wa,g和Wb,g均不相同的个体Wc,g;6.3)根据公式(2)生成变异个体Vi,g:
其中,
n=1,2,...,N为变异个体Vi,g的第n维向量;6.4)对变异个体进行交叉生成测试个体Ui,g:
其中,
n=1,2,...,N为测试个体Ui,g的第n维向量,randb(0,1)为0到1之间的随机小数,rnbr(n)为1到N之间的随机整数;6.5)根据公式(1)计算测试个体Ui,g的相关系数C(Ui,g);6.6)如果C(Ui,g)Gmax,则输出相关系数最大的个体为最终的能量项权重值,并以此权重对应的能量函数对构象空间进行优化,输出能量最低的构象作为最后的预测结构;否则返回步骤6)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810994115.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种测试方法及装置
- 下一篇:一种基于锦标赛机制的自适应蛋白质结构预测方法