[发明专利]一种基于阶段性多策略的群体构象空间采样方法有效
申请号: | 201610121504.8 | 申请日: | 2016-03-03 |
公开(公告)号: | CN105808973B | 公开(公告)日: | 2018-06-01 |
发明(设计)人: | 张贵军;周晓根;俞旭锋;郝小虎;王柳静;徐东伟;李章维 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于阶段性多策略的群体构象空间采样方法,包括以下步骤:在差分进化算法框架下,将整个算法过程分为多个阶段,对每个阶段设置一组策略池,当算法达到某个阶段时,从其对应的策略池中,随机选取一个策略,基于片段组装技术,生成新的测试构象个体,从而提高构象采样能力和算法的收敛速度;同时在构象选择环节引入距离谱约束,当测试构象的能量高于目标构象时,则比较两者的距离差,若测试个体的距离差较小,则以一定的概率接受测试构象,从而引导算法采样得到能量更低且结构更合理的构象,提高算法的预测精度。 | ||
搜索关键词: | 构象 算法 采样 距离差 测试 差分进化算法 采样能力 接受测试 片段组装 算法过程 随机选取 距离谱 组策略 群体 收敛 概率 引入 预测 环节 | ||
【主权项】:
1.一种基于阶段性多策略的群体构象空间采样方法,其特征在于:所述构象空间采样方法包括以下步骤:1)给定输入序列信息;2)根据序列信息从QUARK服务器上得到距离谱文件profile,rpj 为距离谱中记录下的残基对,Dj 为该残基对之间的距离,其中j∈(1,N),N为距离谱中残基对数量;3)设置参数:种群大小NP,算法的迭代次数G,交叉因子CR,阶段因子s,置迭代代数g=0;4)种群初始化:由输入序列产生NP个初始构象Ci ,i={1,…,NP},对每个构象个体全部位置片段组装;5)针对种群中的每个构象个体Ci ,i∈{1,2,3,…,NP},令Ctarget =Ci ,Ctarget 表示目标构象个体,执行以下操作得到变异构象Cmutant :5.1)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,L},L为序列长度;5.2)令a=min(randrange1,randrange2),b=max(randrange1,randrange2),k∈[a,b];令c=min(randrange3,randrange4),d=max(randrange3,randrange4),p∈[c,d];其中min表示取两个数的最小值,max表示取两个数的最大值5.3)如果g<s·G,则执行如下操作:5.3.1)如果randn(1,3)=1,则用Crand2 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Crand1 的相同位置所对应的二面角phi、psi、omega,然后将所得Crand1 进行片段组装得到变异构象Cmutant ,其中randn(1,3)表示随机生成[1,3]之间的整数;5.3.2)如果randn(1,3)=2,则用Crand2 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Crand1 的相同位置所对应的二面角phi、psi、omega;再使用Crand3 上位置c到位置d的片段的第p个氨基酸所对应的二面角phi、psi、omega替换Crand1 上相同位置所对应的二面角phi、psi、omega,然后将所得Crand1 进行片段组装得到测试个体Cmutant ;5.3.3)如果randn(1,3)=3,则用Crand1 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Ctarget 的相同位置所对应的二面角phi、psi、omega;再使用Crand2 上位置c到位置d的片段的第p个氨基酸所对应的二面角phi、psi、omega替换Ctarget 上相同位置所对应的二面角phi、psi、omega,然后将所得Ctarget 进行片段组装得到测试个体Cmutant ;5.4)如果s·G≤g<2s·G,则执行如下操作:5.4.1)根据能量对整个种群中的构象进行升序排列,然后从前0.5NP个构象个体中随机选出一个构象记为Cpbest ;5.4.2)如果randn(1,3)=1,则用Crand1 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Cpbest 的相同位置所对应的二面角phi、psi、omega,然后将所得Cpbest 进行片段组装得到变异构象Cmutant ;5.4.3)如果randn(1,3)=2,则用Cpbest 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Crand1 的相同位置所对应的二面角phi、psi、omega;再使用Crand2 上位置c到位置d的片段的第p个氨基酸所对应的二面角phi、psi、omega替换Crand1 上相同位置所对应的二面角phi、psi、omega,然后将所得Crand1 进行片段组装得到测试个体Cmutant ;5.4.4)如果randn(1,3)=3,则用Cpbest 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Ctarget 的相同位置所对应的二面角phi、psi、omega;再使用Crand1 上位置c到位置d的片段的第p个氨基酸所对应的二面角phi、psi、omega替换Ctarget 上相同位置所对应的二面角phi、psi、omega,然后将所得Ctarget 进行片段组装得到测试个体Cmutant ;5.5)如果g≥2s·G,则执行如下操作:5.5.1)将整个种群随机平均分为三组,判断当前目标构象Ctarget 所在的组,然后从对应的组中选出能量最低的构象Clbest ;5.5.2)如果randn(1,3)=1,则用Crand1 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Cpbest 的相同位置所对应的二面角phi、psi、omega,然后将所得Cpbest 进行片段组装得到变异构象Cmutant ;5.5.3)如果randn(1,3)=2,则用Clbest 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Crand1 的相同位置所对应的二面角phi、psi、omega;再使用Crand2 上位置c到位置d的片段的第p个氨基酸所对应的二面角phi、psi、omega替换Crand1 上相同位置所对应的二面角phi、psi、omega,然后将所得Crand1 进行片段组装得到测试个体Cmutant ;5.5.4)如果randn(1,3)=3,则用Clbest 上位置a到位置b的片段的第k个氨基酸所对应的二面角phi、psi、omega替换Ctarget 的相同位置所对应的二面角phi、psi、omega;再使用Crand1 上位置c到位置d的片段的第p个氨基酸所对应的二面角phi、psi、omega替换Ctarget 上相同位置所对应的二面角phi、psi、omega,然后将所得Ctarget 进行片段组装得到测试个体Cmutant ;6)对变异构象Cmutant 执行交叉操作:6.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,L);6.2)根据
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610121504.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种限制应用使用时间的方法及装置
- 下一篇:旋转图像的方法、计算机及记录介质
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用