[发明专利]一种基于香农熵的多阶段蛋白质结构预测方法有效
申请号: | 201810238703.6 | 申请日: | 2018-03-22 |
公开(公告)号: | CN108614957B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张贵军;谢腾宇;周晓根;王柳静;马来发 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B15/20 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 香农 阶段 蛋白质 结构 预测 方法 | ||
一种基于香农熵的多阶段蛋白质结构预测方法,首先利用Rosetta Abinitio协议对搜索空间进行搜索,通过对背景点的聚类找到潜在天然态区域;然后,在群体进化算法的框架下分阶段执行预测过程,分析每一代种群与潜在天然态区域的关系,通过分类来表明当前种群所处的进化状态;其次,计算种群前后两代的状态转移矩阵并用香农熵来衡量种群的状态转化情况;最后,根据香农熵值在某一阈值内的累计次数进行阶段切换,以最后一代种群作为最终预测结果。本发明提供一种基于香农熵的多阶段蛋白质结构预测方法,根据香农熵进行阶段的动态切换,使得算法的预测精度和鲁棒性显著提高。
技术领域
本发明涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是,一种基于香农熵的多阶段蛋白质结构预测方法。
背景技术
蛋白质是生命的物质基础,是有机大分子,是构成细胞的基本有机物,是生命活动的主要承担者,是由氨基酸以“脱水缩合”的方式组成的多肽链经过盘曲折叠形成的具有一定空间结构的物质。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,折叠或螺旋构成一定的空间结构,从而发挥某一特定功能。蛋白质的三维结构在药物设计、蛋白质工程和生物技术中具有决定性的重要,因此,蛋白质结构预测是一个重要的研究问题。
蛋白质结构实验测定方法包括X射线晶体学、核磁共振光谱、和电子显微镜等,这些方法被广泛用于蛋白质结构测定。X射线晶体学被认为是这些方法中相对可行且准确的测定方法之一。然而,X射线晶体学需要进行一个复杂的结晶过程,而对于一些不易结晶的蛋白(如膜蛋白),此方法无法用于结构测定。此外,这些实验测定方法极其耗时,代价昂贵,而且容易发生错误。
根据Anfinsen原则,以计算机为工具,运用适当的算法,从氨基酸序列出发直接预测蛋白质的三维结构,成为当前生物信息学中一种主要的研究课题。而从头预测方法基于Anfinsen假说出发建立起蛋白质物理或知识能量模型,然后设计适当优化算法求解最小能量构象的一种优化方法。一方面,从生物学意义上来讲,该方法有助于揭示蛋白质折叠机理,进而能够最终阐明生物学中心法则中的第二遗传密码理论部分;另一方面,从现实意义来讲,该方法具有普遍性,对于序列相似度20%或寡肽(10个残基的小蛋白)来说,从头预测方法是唯一的选择。Rosetta,QUARK等基于知识建立能量模型,在历届CASP赛事中表现突出。然而,该方法预测序列较长的目标蛋白时,搜索空间会呈指数增加、预测精度急剧下降,从而导致采样能力不足、阶段切换不恰当、不能保留优秀中间结果和浪费计算资源等问题。
因此,现有的基于能量函数的多阶段蛋白质结构预测方法在阶段切换和预测精度方面存在着缺陷,需要改进。
发明内容
为了克服现有的基于能量函数的多阶段蛋白质结构预测方法在阶段切换和预测精度方面的不足,本发明提出一种阶段切换合理、预测精度高的香农熵引导多阶段切换的蛋白质结构预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于香农熵的多阶段蛋白质结构预测方法,所述方法包括以下步骤:
1)给定输入序列信息,利用Robetta服务器获得该序列的片段库;
2)Markov状态模型的构建,过程如下:
2.1)获取nstruct个背景点:运行Rosetta Abinitio协议nstruct次,记录每次运行的构象结果,作为背景点;
2.2)计算nstruct个背景点之间的方均根差距离RMSD,组成距离矩阵D;
2.3)根据距离矩阵D,利用k-mediods聚类方法对nstruct个背景点分类,得到m个簇心,作为m个Markov状态;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810238703.6/2.html,转载请声明来源钻瓜专利网。