[发明专利]一种基于距离约束选择策略的群体构象空间优化方法有效
| 申请号: | 201510608518.8 | 申请日: | 2015-09-22 |
| 公开(公告)号: | CN105205348B | 公开(公告)日: | 2018-09-18 |
| 发明(设计)人: | 张贵军;俞旭锋;周晓根;郝小虎;徐东伟;李章维 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F19/16 | 分类号: | G06F19/16;G06N3/00 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种基于距离约束选择策略的群体构象空间优化方法,包括以下步骤:在差分进化算法框架下,采用Rosetta Score3粗粒度知识能量模型来有效降低构象空间搜索维数、提高算法的收敛速度;引入基于知识的片段组装技术可以有效提高预测精度;利用距离谱在蛋白质结构上的特性约束,使更多结构上相似的蛋白质构象进入种群,减少能量函数不精确带来的误差,以得到更为优良的局部构象;结合差分进化算法较强的全局搜索能力,可以对构象空间进行更为有效的采样,从而得到和天然态结构相似度较高的构象。本发明采用Rosetta Score3粗粒度知识能量模型来有效降低构象空间搜索维数、提高算法的收敛速度,提高预测精度。 | ||
| 搜索关键词: | 一种 基于 距离 约束 选择 策略 群体 构象 空间 优化 方法 | ||
【主权项】:
1.一种基于距离约束的群体构象空间优化方法,其特征在于:所述构象空间搜索方法包括以下步骤:1)给定输入序列信息;2)根据序列信息从QUARK服务器上得到距离谱文件profile,rpn为距离谱中记录下的残基对,Dn为该残基对之间的距离,其中n∈(1,N),N为距离谱中残基对数量;3)设置系统参数:种群大小NP,算法的迭代次数T,交叉因子CR;4)种群初始化:由输入序列产生NP个种群个体Pinit,k其中k∈(1,NP),对每个个体全部位置片段组装;5)开始迭代,依次对种群中的每个个体进行以下操作:5.1)设i=1,其中i∈{1,2,3,…,NP};令Ptarget=Pi,其中i为序号,Ptarget表示目标个体;5.2)随机生成正整数rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4个随机整数randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length为序列长度;5.3)针对个体Pj做变异操作,其中:j=rand1;5.3.1)令a=min(randrange1,randrange2),b=max(randrange1,randrange2);令c=min(randrange3,randrange4),d=max(randrange3,randrange4);其中min表示取两个数的最小值,max表示取两个数的最大值;5.3.2)用Prand2上位置a到位置b的片段的氨基酸所对应的二面角phi、psi、omega替换Pj的相同位置所对应的二面角phi、psi、omega;再使用Prand3上位置c到位置d的片段的氨基酸所对应的二面角phi、psi、omega替换Pj上相同位置所对应的二面角phi、psi、omega,再将所得Pj进行片段组装得到测试个体Ptrail;5.4)针对测试个体Ptrail做交叉操作;5.4.1)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);5.4.2)根据
执行交叉过程:若随机数rand4≤CR,个体Ptrail的片段rand5替换为个体Ptarget中对应的片段,否则直接继承个体Ptrail;5.5)针对目标个体Ptarget和测试个体Ptrail进行选择操作;5.5.1)计算Ptarget和Ptrail的能量:E(Ptarget)和E(Ptrail);5.5.2)若E(Ptarget)>E(Ptrail)则用Ptrail替换Ptarget,进入5.6);否则继续执行5.5.3);5.5.3)计算目标个体Ptarget和测试个体Ptrail在残基对rpn的距离相对于距离谱中Dn之间的距离差▽targetDn和▽trailDn;5.5.4)判断▽targetDn和▽trailDn的值,若大于6,则令其等于6,去除一些距离差值较大的异常数值;5.5.5)计算距离谱中所有位置的目标个体和测试个体的距离差值总和
5.5.6)若▽Dtrail>▽Dtarget,则进入5.6);若▽Dtrail<▽Dtarget,则产生一个(0,1)之间的随机数rand6,若rand6小于0.2,则用Ptrail替换Ptarget,否则进行5.6);5.6)i=i+1;判断i是否大于等于NP,是则进入5.7),否则返回到5.1);5.7)迭代的运行5.1)~5.6),至满足终止条件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510608518.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种办公室局部温度调节器
- 下一篇:一种真空浮力砖
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





