[发明专利]一种基于排挤策略的多模态蛋白质结构预测方法有效
申请号: | 201810994504.8 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109360601B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 张贵军;王柳静;刘俊;周晓根;谢腾宇;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B40/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 排挤 策略 多模态 蛋白质 结构 预测 方法 | ||
一种基于排挤策略的多模态蛋白质结构预测方法,包括以下步骤:1)给定输入序列信息以及蛋白质力场模型;2)初始化;3)变异、交叉操作;4)生成存档集合;5)计算聚类中心和聚类半径;6)排挤操作;7)聚类操作;8)判断是否满足终止条件,如果满足则终止,并输出所有的最优解。本发明提出一种基于排挤策略的多模态蛋白质结构预测方法,该方法在差分进化算法的框架下,采用排挤策略,在进化过程中自适应地形成多个模态,使之能够发现模型所有的局优解,并且在此过程中尽可能多地保存局优解,从而提高蛋白质结构预测方法的预测精度。本发明提供一种预测精度较高的基于排挤策略的多模态蛋白质结构预测方法。
技术领域
本发明涉及一种生物信息学、智能优化、计算机应用领域,尤其涉及的是一种基于排挤策略的多模态蛋白质结构预测方法。
背景技术
Science于2005年发表的125个科学问题中提出“蛋白折叠能否被预测的问题”,表明以蛋白质为代表的生物大分子结构测定,不仅是分子生物学中心法则尚未解决的基础理论问题,更是关乎人类切身利益的医学、药学及材料学等领域亟待解决的应用问题。比如,朊蛋白(Prion Protein,PrP)的结构变异将引发疯牛病,而蛋白质错误折叠会导致阿兹海默症、帕金森氏症等疾病。因此,深入了解蛋白质天然态结构与其折叠机理将有助于阐明这些疾病的致病机制并寻找治疗方法。
结构生物学实验是测定生物大分子结构的主要技术手段。卡文迪许实验室于60年代用X-射线晶体衍射技术获得了球蛋白的结构,从晶体水平进行生物大分子的研究;多维核磁共振(NMR)方法可以直接测定蛋白质在溶液中的构象,更接近于生理状态;近期发展的冷冻电镜技术,通过电子显微镜技术并结合图像处理技术可直接提供生物大分子的形貌信息。目前PDB中的蛋白质三维结构主要通过结构实验测定技术得到,不仅存在应用局限,测定过程也费时费钱费力,比如,使用NMR方法测定一个蛋白质通常需要15万美元以及半年的时间,因此实验测定蛋白质三维结构的速度远远达不到所需速度。鉴于结构测定耗资巨大以及信息科学技术的飞速发展,以计算机为工具,运用适当的算法,从序列出发直接预测生物大分子的三维结构,在后基因组时代生命科学的理论和应用研究中将发挥日益重要的作用。
不依赖于任何已知结构,基于Anfinsen热力学假说,构建蛋白质能量函数,通过有效的构象搜索方法来搜寻目标蛋白的天然结构。Anfinsen热力学假说认为蛋白质的天然结构具有热稳定性,对应于蛋白质及周围溶剂分子所构成的整个体系的自由能极小点,因此从头预测方法通常采用片段组装技术,在构象搜索过程中指导算法向低能量构象进行搜索。通过全局优化方法确定蛋白质的结构,是基于其全局极小描述蛋白质天然结构的打分函数,然而分子内作用与周围环境作用的复杂性,将形成一个具有大量局部极小的粗糙能量地貌,由于能量模型的复杂性和不精确性,使得数学上的最优解并不一定对应其稳定的天然结构,有时局部极值解才真正与蛋白质实测基态构型吻合。由于能量模型的复杂性和不精确性,使得数学上的最优解并不一定对应其稳定的天然结构,有时局部极值解才真正与蛋白质实测基态构型吻合。另外,鉴于粗糙不平的表面是蛋白质能量地貌的固有属性,计算量将随着分子的大小呈指数增长。基于上述考虑,有必要从蛋白质结构预测方法的多模态特性方面进行深入研究。
因此,目前的蛋白质结构预测方法在对能量模型多极值解的搜索上存在不足,需要改进。
发明内容
为了克服现有的蛋白质结构预测方法在搜索能量模型多极值解上的不足,本发明提出一种基于排挤策略的多模态蛋白质结构预测方法,该方法在差分进化算法的框架下,采用排挤策略,在进化过程中自适应地形成多个模态,使之能够发现模型所有的局优解,并且在此过程中尽可能多地保存局优解,从而提高蛋白质结构预测方法的预测精度。
本发明解决其技术问题所采用的技术方案是:
一种基于排挤策略的多模态蛋白质结构预测方法,所述方法包括以下步骤:
1)给定输入序列信息,以及蛋白质力场模型,即能量函数Rosetta Score3;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810994504.8/2.html,转载请声明来源钻瓜专利网。