[发明专利]一种多域蛋白距离谱构建方法有效
申请号: | 201710605462.X | 申请日: | 2017-07-24 |
公开(公告)号: | CN107609340B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 张贵军;周晓根;王柳静;郝小虎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白 距离 构建 方法 | ||
一种多域蛋白距离谱构建方法,采用蛋白质比对工具对多域蛋白中各单域蛋白与模板的比对进行一对一打分,然后计算整个模板的综合得分;选取综合得分最高的部分模板蛋白提取所比对上的各残基之间的距离构建距离谱,并通过一系列条件来控制距离谱的质量,以保证距离谱的精确性。通过实际构象中各残基之间的距离与距离谱之间的平均误差对组装构象进行打分。本发明提供一种能够提高打分函数精确性的多域蛋白距离谱构建方法。
技术领域
本发明涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是一种多域蛋白距离谱构建方法。
背景技术
在现有蛋白数据库中,至少有75%的蛋白包含了多个域蛋白。随着新蛋白发现,多域蛋白的数量也在日益上升。大部分多域蛋白由于规模太大而无法一次性预测到期结构,现有多域蛋白结构预测方法有穿线法和单域组装法,其中最常用的单域组装法首先将多域蛋白分成多个单域蛋白,然后对每个单域蛋白的结构进行单独预测,最后在对每个单域蛋白的结构进行组装,从而得到完整的多域蛋白结构。
与单域蛋白结构预测一样,在多域蛋白中需要采用打分函数对组装得到的每一个构象进行打分,从而根据打分来判断构象的接受与否。现有单域蛋白结构的打分函数在多域蛋白结构组装中无法使用,例如域内各残基之间的相互作用力与域和域之间的作用力截然不同。为了解决上述问题,一些方法通过对各域蛋白之间的连接区域的构象进行采样,并采用单域蛋白结构预测方法的打分函数进行打分,从而选择质量较高的连接构象来组装各单域蛋白。然而,由于缺乏域和域之间的方向引导信息,现有打分函数不精确,导致一些质量较高的构象丢失,从而导致多域蛋白的结构预测较低。
因此,现有的多域蛋白打分函数在精确性上存在缺陷,需要改进。
发明内容
为了克服现有的多域蛋白打分函数精确性较低的不足,本发明采用蛋白质比对工具搜索多域蛋白的模板,从而通过提取模板蛋白中所比对上的各残基之间的距离构建距离谱,通过实际构象中各残基之间的距离与距离谱之间的平均误差对组装构象进行打分。本发明提供一种能够提高打分函数精确性的多域蛋白距离谱构建方法。
本发明解决其技术问题所采用的技术方案是:
一种多域蛋白距离谱构建方法,所述方法包括以下步骤:
1)参数初始化:距离谱提取模板蛋白个数T,模板得分阈值S,模板比对百分比P;
2)输入多域蛋白的各单域的三维结构;
3)根据对蛋白库中的每一个多域蛋白模板进行打分,过程如下:
3.1)采用蛋白质模板比对工具TM-align依次计算每一个单域蛋白与模板之间的比对得分TM-score1,TM-score2,…,TM-scoreD,其中,D为多域蛋白中单域蛋白的个数;
3.2)计算该模板的比对总得分:
其中,TM-scorei为第i个单域蛋白与模板之间的比对得分,Li为第i个单域蛋白的序列长度;
4)选取模板比对总得分最高的前T个蛋白建立距离谱,过程如下:
4.1)判断模板的比对总得分是否大于S,且该模板与各单域蛋白的比对残基个数是否均大于P×Li,如果满足以上两个条件,则继续步骤4.2);
4.2)针对两个相邻的单域蛋白,如果其第m个残基和第n个残基在模板上有比对残基Am和An,则继续步骤4.3);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710605462.X/2.html,转载请声明来源钻瓜专利网。