[发明专利]一种基于树结构副本交换和片段组装的蛋白质结构预测方法在审
申请号: | 201410353661.2 | 申请日: | 2014-07-23 |
公开(公告)号: | CN104200130A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | 张贵军;秦传庆;周晓根;郝小虎;梅珊;陈先跑;李章维 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 副本 交换 片段 组装 蛋白质 预测 方法 | ||
技术领域
本发明涉及计算机应用领域,生物信息学,算法优化,最优化理论,分子信息学,特别涉及一种蛋白质结构三维结构预测方法。
背景技术
生物信息学通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。是当前研究的一个热点。生物信息学研究成果已经被广泛应用于序列比对,蛋白质比对,基因识别分析,分子进化,序列重叠群装配,遗传密码,药物设计,生物系统,蛋白质结构预测等。其中蛋白质结构预测是生物信息学领域的一个重要的分支。
蛋白质分子在生物体的细胞活动中有很大的作用,生物体的许多活动都是以蛋白质的活性作为基础。蛋白质分子的结构决定蛋白质分子功能。因此,对生物分子结构和生物活性态建模对理解并治疗与蛋白质相关的疾病有很大的帮助作用。并且对工程蛋白的制造有指导意义。
蛋白质分子的结构可在实验室环境下采用实验条件予以获得。主要的方法是:X射线晶体衍射、核磁共振技术以及电子显微镜[3]等。但是在实验室条件下获得蛋白质分子结构也存在代价大、时间周期比较长的难题。因此,这也催生出使用计算机的运算能力和计算机算法来实现蛋白质结构的预测的方法。
蛋白质的氨基酸序列信息决定蛋白质的三维结构(Anfinsen1973)的这个观点被广泛地接受,也是使用计算机实现蛋白质结构预测的理论依据。但是利用计算机的运算能力和优化算法通过蛋白质的序列信息来预测蛋白质的三维结构,也就是说蛋白质折叠问题仍然是一个难题。
蛋白质结构预测的困难主要在两个方面,首先是蛋白质结构预测所使用的能量模型不精确,其次是蛋白质的构象空间是极其庞大和复杂的。
发明内容
为了克服现有的蛋白质结构预测方式的计算量较大、计算时间比较长的不足,本发明提供一种基于树结构副本交换和片段组装的蛋白质结构预测方法,采用将分层和离散化的方法,可以大大减少计算量,缩短计算时间,同时保证搜索到能量较低的构象,达到预测蛋白质结构的目的。
本发明解决其技术问题所采用的技术方案是:
一种基于树结构副本交换和片段组装的蛋白质结构预测方法,所述预测方法包括以下步骤:
A1、蛋白质构象处理,过程如下;
STEP1.1、根据获得的蛋白质氨基酸序列使用Rosetta套装软件pose_from_sequence函数构建蛋白质长链;
STEP1.2、并将获取的蛋白质长链使用Rosetta构建的Mover对象SwitchResidueTypeSetMover,使用其apply方法将构建的蛋白质长链的全原子构象转换成骨链原子构象,该蛋白质构象用pose表示;
STEP1.3、将上述转换完成pose使用随机数分别给定每个氨基酸位置的(α,β,ω);
STEP1.4、将上述的STEP1.1、STEP1.2、STEP1.3步骤执行n次,n是副本总数;
A2、片段库构建,过程如下;
STEP2.1、将蛋白质的序列提交到提供根据特定序列产生片段库的服务器网站,服务器处理完成之后返回特定的片段库文件;
STEP2.2、使用Rosetta软件套装构建的Mover对象ClassicFragmentMover,根据给定的片段文件构建此对象;
A3、温度参数KT列表设置,过程如下;
STEP3.1、根据副本数目,设定相同数目的KT列表的大小;
STEP3.2、使用Rosetta提供的score3力场模型构建能量函数scorefxn;
STEP3.3、根据KT列表和pose对象以及scorefxn实例化Rosetta软件套装提供的MonteCarlo对象,组成一个列表mc,其大小和KT列表相同;
A4、蛋白质构象的能量计算
STEP4.1、采用上述的scorefxn计算pose对象得到能量值;
STEP4.2、根据上述求得的能量值进行分层处理,具体是根据蛋白质的能量分布,进行层处理,本程序按照两个能量单位一层进行处理,根据能量值得到本pose对象所处的能量空间的位置;
A5、蛋白质形状特征提取,过程如下;
STEP5.1、首先传入蛋白质对象;
STEP5.2、从上述对象里面提取出来各个采样点的坐标,所述坐标是三维的笛卡尔坐标,假定采样点的坐标共有n个;
STEP5.3、由公式(1)求得上述对象的质心坐标,即几何中心坐标centroid(x,y,z);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学;,未经浙江工业大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410353661.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种构象空间动态步长搜索方法
- 下一篇:一种铅锌冶炼污染减排技术集成方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用