[发明专利]一种基于排挤策略的多模态蛋白质结构预测方法有效
申请号: | 201810994504.8 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109360601B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 张贵军;王柳静;刘俊;周晓根;谢腾宇;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于排挤策略的多模态蛋白质结构预测方法,包括以下步骤:1)给定输入序列信息以及蛋白质力场模型;2)初始化;3)变异、交叉操作;4)生成存档集合;5)计算聚类中心和聚类半径;6)排挤操作;7)聚类操作;8)判断是否满足终止条件,如果满足则终止,并输出所有的最优解。本发明提出一种基于排挤策略的多模态蛋白质结构预测方法,该方法在差分进化算法的框架下,采用排挤策略,在进化过程中自适应地形成多个模态,使之能够发现模型所有的局优解,并且在此过程中尽可能多地保存局优解,从而提高蛋白质结构预测方法的预测精度。本发明提供一种预测精度较高的基于排挤策略的多模态蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 排挤 策略 多模态 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于排挤策略的多模态蛋白质结构预测方法,其特征在于:所述预测方法包括以下步骤:1)给定输入序列信息,以及蛋白质力场模型,即能量函数Rosetta Score3;2)初始化:迭代Rosetta协议第一、二阶段,产生具有NP个构象的种群Pg,记为
i∈{1,2,…,NP},其中
为第g代种群的第i个构象,设置最大迭代次数Gmax并初始化迭代次数g=0;3)通过差分进化算法的交叉、变异操作生成种群Pg的试验构象种群Ug,记为
i∈{1,2,…,NP},其中
为第g代种群的第i个试验构象。置i=1,过程如下:3.1)从种群Pg中选定目标个体
并从种群Pg中随机选择两个互异且不同于
的个体
3.2)在[0,L‑9]内生成均匀随机整数rand1、rand2和rand3,其中L表示氨基酸序列长度;3.3)将
的第rand1至rand1+8号残基的二面角值替换成
对应残基号的二面角值,将
的第rand2至rand2+8号残基的二面角值替换成
对应残基号的二面角值,生成变异个体
再将
的第rand3至rand3+8号残基的二面角值替换成变异个体
对应残基号的二面角值,生成试验个体
3.4)i=i+1,循环步骤3.1)‑3.4)直至生成当前种群的试验个体种群Ug;4)为种群Pg中的每一个构象
生成其对应的存档集合
置i=1,过程如下:4.1)对Ug中的每一个试验构象
t∈{1,2,…,NP},置t=1,计算
与Pg所有构象的均方根偏差RMSD,若其中最小的RMSD值是由
与
产生的,则将
放入存档集合
中;4.2)t=t+1,重复步骤4.1),直至t=NP,记此时
中的构象数为n;4.3)将
同样放入
中,则此时
中的构象数为n+1;4.4)i=i+1,循环步骤4.1)‑4.4)直至为每一个构象
均生成其对应的
5)对每一个
其聚类中心
和聚类半径rig生成如下:![]()
其中
为存档集合
中的第j个构象,
为
的构象能量值,
为
与
之间的RMSD值;6)排挤操作:用
取代
进入下一代种群中,即生成
i=1,2,...,NP,并且对应的rig+1等于rig;7)聚类操作:生成当前第g+1代种群的模态构象集合
s=1,2,...,K,其中
有对应的聚类半径
模态构象数为K,置i=1,过程如下:7.1)Mg+1初始化为只有一个构象的集合,该构象为种群Pg+1中的最好构象;7.2)将
与Mg+1中的所有构象相比,若满足如下公式,将
i=1,2,...,NP放入Mg+1;
其中
为
和
之间的RMSD值;7.3)i=i+1,循环步骤7.1)‑7.3)直至为第g+1代种群找到所有的模态构象;8)判断是否满足终止条件,若满足则输出结果并退出,否则g=g+1清空Mg+1并且返回步骤3)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810994504.8/,转载请声明来源钻瓜专利网。