[发明专利]一种基于残基对距离约束的蛋白质结构预测方法在审
| 申请号: | 202010708524.1 | 申请日: | 2020-07-22 |
| 公开(公告)号: | CN112085246A | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 张贵军;李亭;刘俊;周晓根;陈芳 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G16B15/00;G16B30/10;G06N3/00 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 残基 距离 约束 蛋白质 结构 预测 方法 | ||
一种基于残基对距离约束的蛋白质结构预测方法,首先,采用片段重组和片段组装策略,广泛的搜索构象空间;然后利用预测的残基距离图实时构建局部扰动模型,利用差分进化算法快速求解扰动量,生成结构多样化的候选构象,进一步改善二级结构间的位置关系。最终,提高整体结构的精度和效率。本发明提供一种预测精度较高的基于残基对距离约束的蛋白质结构预测方法。
技术领域
本发明涉及生物信息学、计算机应用领域,尤其涉及的是一种基于残基对距离约束的蛋白质结构预测方法。
背景技术
蛋白质是生命活动的重要承担者。全面理解蛋白质的生物学功能是人类探索生命奥秘的必经之路。从新陈代谢到疾病免疫,都离不开蛋白质的作用。蛋白质只有折叠成特定的三维结构才能行使其生物学功能。“结构决定功能”是蛋白质组学相关研究领域的重要指导准则。通过获取蛋白质的三维结构,来分析和理解蛋白质生物学功能是最为有效的方法之一。
目前,蛋白质的三维结构主要通过生物湿实验的方法获取。生物湿实验测定蛋白质结构的方法主要包括X射线晶体衍射、核磁共振、冷冻电镜技术。这类方法最为准确但是十分复杂,存在耗时、费力、成本高的问题,而且不能精确测定氨基酸残基数目较多的蛋白质三维结构。
随着高通量测序技术的飞速发展,未测定结构的蛋白数量也在不断增大。因此,急需一种高通量的蛋白质结构获取新方法。在理论探索和应用需求的双重推动下,根据Anfinsen法则,利用生物计算手段来预测蛋白质结构在20世纪末得到了蓬勃发展。根据氨基酸序列预测蛋白质三维结构的方法主要有同源建模法和从头预测法。从头预测方法直接基于蛋白质的物理或知识能量模型,利用优化算法在构象空间中搜索全局最优解。全世界范围内有许多研究机构致力于研究利用生物大数据、人工智能、系统优化技术预测蛋白质三维结构,并逐渐应用于疾病诊断和药物设计,其中具有代表性的研究团队有美国华盛顿的David Baker实验室、美国密歇根大学的张阳实验室等。国内越来越多的高校和研究机构也加入到蛋白质结构预测的研究当中。
蛋白质结构预测是一个高维复杂的非凸多模态优化问题。现有的方法一方面由于能量函数的不精确,在构象搜索时不能得到令人满意的结果;另一方面优化方法采样能力不足,极易陷入局部最优,影响预测精度。
因此,现有的蛋白质结构预测方法存在能量函数不精确、采样效率低、预测精度不足等问题,需要改进。
发明内容
为了解决现有的蛋白质结构预测方法存在能量函数不精确、采样效率低、预测精度不足等问题,本发明提出了一种基于残基对距离约束的蛋白质结构预测方法。首先,基于预测的残基对距离分布,构建了基于残基对距离的势能函数;然后,利用片段重组和组装大范围搜索构象空间,形成较为完整的拓扑结构;最后,设计了基于残基对距离约束的loop区域采样策略,进一步提升预测精度,最终达到提整体结构精度的目的。
本发明解决其技术问题所采用的技术方案是:
一种基于残基对距离约束的蛋白质结构预测方法,包括以下步骤:
1)输入预测蛋白质的目标序列,获取片段库和残基对距离分布文件,过程如下:
1.1)根据目标蛋白质序列从ROBETTA服务器(http://www.robetta.org/)上获取3片段和9片段的片段库文件,根据目标蛋白质序列从trRosetta服务器(https://yanglab.nankai.edu.cn/trRosetta/)上获取预测的残基对距离分布文件;
1.2)残基对距离数据处理:去除残基对序列分离小于6的残基对;对残基对距离分布进行高斯拟合,得到距离均值和方差,根据方差由小到大对残基对进行排序;
2)设置参数:种群规模NP、迭代次数G;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010708524.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





