[发明专利]一种基于进化算法与存档更新的蛋白质结构预测方法有效
申请号: | 202110236438.X | 申请日: | 2021-03-03 |
公开(公告)号: | CN112908408B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 戴红伟;高尚策;雷振宇;杨玉;贾东宝 | 申请(专利权)人: | 江苏海洋大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B20/20;G16B40/30 |
代理公司: | 北京和联顺知识产权代理有限公司 11621 | 代理人: | 闫超良 |
地址: | 222000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 进化 算法 存档 更新 蛋白质 结构 预测 方法 | ||
1.一种基于进化算法与存档更新的蛋白质结构预测方法,该方法包括如下步骤:
步骤一:确定蛋白质的构象方式和编码方案;
确定蛋白质的构象方式为扭转角(Torsion Angle)方式,每一个氨基酸包含了-Cα-N-构成的Φ角,-Cα-N-构成的Ψ角,肽键形成的ω角,以及侧链角χ,其中由于肽键构象呈一个平面,因此ω角为180°;不同的氨基酸拥有不同的侧链个数,因此基因位依次代表每一个氨基酸的Φ角Ψ角和χ角;
步骤二:定义解空间,随机生成初始化种群P;
初始化种群,定义参数包括:种群大小,变异概率,杂交概率、最大迭代次数、存档大小以及方向多样性函数中的候选个体数L和近邻个体数K;
步骤三:定义多目标的目标函数、收敛性函数以及方向多样性函数;选择四个相互冲突的目标函数来反映解的优劣:两个基于物理的能量函数分别计算蛋白质内部能量和外部能量,一个可溶解性表面积来约束蛋白质体积,一个基于方向和距离统计的能量函数衡量蛋白质的优劣性;收敛性函数计算解的收敛潜力,较小的收敛性函数的值代表该解具有较好的收敛潜力;方向多样性函数保障种群具有一个较高的种群多样性;
步骤四:计算个体的每一个目标函数值以及收敛性函数的值FC,根据非支配排序结果和收敛性函数的值在种群中选择个体放入杂交池;
在每一次迭代中,计算个体的每个目标函数以及收敛性函数的值,随机选择两个个体,若存在支配关系将支配者放入杂交池;若两个个体是非支配的并且收敛性函数值是不等的,将具有更小收敛性函数值的个体放入杂交池;否则随机选择一个个体放入杂交池;
步骤五:对杂交池中的个体进行变异和交叉操作;将杂交池中的个体根据改进的变异概率进行变异和交叉操作;
步骤六:通过收敛性函数和方向多样性函数,对交叉和变异后的个体进行环境选择产生下一代种群;在遗传操作后,计算每个新个体的函数值;将新个体和父代个体组合,并进行非支配排序;依次将帕累托前沿放入一个空种群P中直至该种群在加入第i个帕累托前沿Fi后,该种群大小大于或等于父代种群大小;当加入后,该种群大小等于父代种群大小时,该种群即为下一代种群;若加入后的种群大小大于父代种群,则在Fi中选择个体放入直至该种群大小等于父代种群大小,首先将P和Fi中的个体投射在一个超平面上,为了方便衡量收敛性和方向多样性;若当前种群为空则计算Fi中每个个体到Fi中其它个体的K近邻个体的距离;选择L个距离最小的候选个体,若当前种群不为空,则计算Fi中每一个个体到P中其它个体的K近邻个体的距离,选择L个距离最小的候选个体,最后在L个候选个体中选择一个个体放入P中;重复该操作直至P的大小等于父代种群的大小;
步骤七:通过存档更新策略,将新种群中高质量的解放入存档中;将新种群中的个体和存档中的个体组合,并进行非支配排序,然后将第一帕累托前沿的个体放入存档中;若存档大小大于最大存档大小,计算每个个体的拥挤距离,删除密集的个体以确保种群的多样性;
步骤八:若满足终止条件,则循环结束;若不满足,则返回到步骤四继续向下执行;满足最大迭代次数之后,输出操作得到的最优目标值,以及所对应的最优调度序列;
步骤九:通过基于聚类的决策方式,在存档中选择最终的蛋白质,计算存档中蛋白质之间的RMSD和TM值,通过聚类方式,在存档中选取最终的个体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏海洋大学,未经江苏海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110236438.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源6×6特种底盘车驱动结构
- 下一篇:一种可降解土工织物充填袋