[发明专利]基于混沌蜂群算法的蛋白质三维结构预测方法有效
| 申请号: | 201210406292.X | 申请日: | 2012-10-23 | 
| 公开(公告)号: | CN102915407A | 公开(公告)日: | 2013-02-06 | 
| 发明(设计)人: | 郭躬德;王怡;孔祥增 | 申请(专利权)人: | 福建师范大学 | 
| 主分类号: | G06F19/16 | 分类号: | G06F19/16;G06N3/00 | 
| 代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 | 
| 地址: | 350007 *** | 国省代码: | 福建;35 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 基于 混沌 蜂群 算法 蛋白质 三维 结构 预测 方法 | ||
技术领域
本发明涉及蛋白质三维结构预测技术领域,特别是一种基于混沌蜂群算法的蛋白质三维结构预测方法。
背景技术
蛋白质结构预测问题也称为蛋白质折叠问题。蛋白质折叠结构的形状在很大程度上决定了其生物功能,掌握蛋白质的结构信息对于研究蛋白质的功能和作用具有重要的意义。因此,蛋白质三维结构预测已成为生物信息学重要的研究问题之一。
目前,蛋白质结构的测定技术主要有X射线晶体衍射法(X-ray diffraction)、核磁共振技术(nuclear magnetic resonance, NMR)。尽管蛋白质结构测定技术有了较为显著的进展,但是通过实验方法确定蛋白质结构的过程仍然非常复杂,代价较高。因此,出现了许多利用计算机预测蛋白质结构的方法,主要包括:同源建模法(homology modeling)、折叠识别法(folding recognition)、从头预测法(abinitio method)等。
基于Anfinesen等在1973年提出的蛋白质天然构象对应能量最低的热力学假说,使用理论计算方法从氨基酸序列预测蛋白质的天然结构成为可能。蛋白质折叠预测问题转化为两个关键问题:一是提出能更好地反映氨基酸残基间相互作用和环境等的数学模型;二是根据热力学假设发展高效的搜索方法,从蛋白质的势能表面上的多个局部极小值中搜索全局最小值。随着蛋白质序列长度的增加,搜索空间的计算量呈指数增长。因此,必须建立一个能区分蛋白质的天然构象与非天然构象的粗粒模型。目前被广泛应用的是AB非格模型,它认为蛋白质结构形成过程中最主要的力是疏水作用,将氨基酸抽象为疏水性(Hydrophobic)和亲水性(Hydrophilic)。在AB非格模型的基础上,设计一个优化算法来搜索最好的蛋白质天然构象成为蛋白质三维结构预测问题的关键。然而,即使应用了简化的模型,蛋白质结构预测依然是一个NP困难问题。
在过去的几十年间,学者们在预测蛋白质三维结构问题上提出了许多算法来解决搜索全局最优解问题。例如,遗传算法与模拟退火算法相结合的方法,比其他的方法更具高效性;改进的禁忌搜索算法,避免了算法迂回搜索,提高了算法的搜索性能和鲁棒性;将禁忌算法应用于遗传算法中,快速准确地搜索到蛋白质的结构,比其他算法求得的最低能量更低。然而,这些方法结合了多种算法,运行时间长、效率低,具有一定的局限性。
发明内容
本发明的目的在于提供一种基于混沌蜂群算法的蛋白质三维结构预测方法,该方法不仅具有较好的预测性能和预测精度,而且运行时间短,运行效率高。
本发明的目的是按如下的技术方案实现的:本发明基于混沌蜂群算法的蛋白质三维结构预测方法,对于含有n个残基的蛋白质,将蛋白质三维结构抽象成2n-5维空间中的一个点,即混沌蜂群算法中食物源的位置,然后采用混沌蜂群算法按如下步骤进行蛋白质三维结构预测:
(1) 初始化参数:食物源规模SN,算法最大循环次数Maxloop,搜索次数limit,混沌搜索最大迭代次数Cmax,种群最小能量值Emin和最优个体hmin,设置算法当前迭代次数loopcount=0,食物源搜索计数器ci=0(i=1,2,...,SN);
(2) 随机产生SN个食物源 ;
(3) 采用公式计算所有食物源的能量值,得到最优能量E0及其对应的最优解h0,更新当前最优解hmin=h0和当前最优能量Emin=E0;
(4) 每完成一次步骤(3)的计算,则当前迭代次数loopcount加1,并判断当前迭代次数loopcount是否小于最大循环次数Maxloop,是则转步骤(5),否则终止算法,输出全局最优解hmin和全局最优能量Emin;
(5) 按公式搜索所有食物源的领域解,计算其能量值,若新食物源的能量值低于原食物源的能量值,则用新食物源替换原食物源,否则保留原食物源,且对应的搜索计数器c加1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建师范大学,未经福建师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210406292.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





