[发明专利]一种基于残基对距离约束的蛋白质结构预测方法在审
| 申请号: | 202010708524.1 | 申请日: | 2020-07-22 |
| 公开(公告)号: | CN112085246A | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 张贵军;李亭;刘俊;周晓根;陈芳 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G16B15/00;G16B30/10;G06N3/00 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 残基 距离 约束 蛋白质 结构 预测 方法 | ||
1.一种基于残基对距离约束的蛋白质结构预测方法,其特征在,所述蛋白质结构预测方法包括以下步骤:
1)输入预测蛋白质的目标序列,获取片段库和残基对距离分布文件,过程如下:
1.1)根据目标蛋白质序列从ROBETTA服务器上获取3片段和9片段的片段库文件,根据目标蛋白质序列从trRosetta服务器上获取预测的残基对距离分布文件;
1.2)残基对距离数据处理:去除残基对序列分离小于6的残基对;对残基对距离分布进行高斯拟合,得到距离均值和方差,根据方差由小到大对残基对进行排序;
2)设置参数:种群规模NP、迭代次数G;
3)种群初始化:利用Rosetta协议第一阶段产生种群规模为NP的种群T={T1,T2,...,TNP},其中Tn表示种群T中的第n个蛋白质构象,n∈{1,2,...,NP},用Rosetta score3能量函数计算种群中每个个体的能量,个体Ti的能量为score3(Ti);
4)根据处理后的残基对距离数据构建个体的距离势能函数:
其中varij是残基对(i,j)距离高斯拟合出的方差值,Dij是目标个体残基i和残基j之间的真实距离,dij是预测得到的残基i和残基j之间的距离;
5)设g=1,其中g∈{1,2,...,G};
6)设n=1,其中n∈{1,2,...,NP};
7)片段重组,过程如下:
7.1)从种群T中随机选择三个互异且不同于目标构象Ti的构象Tr1、Tr2和Tr3,从Ti、Tr2和Tr3中随机选择三个不同位置的片段f1、f2和f3,片段长度为9;
7.2)用片段f1、f2和f3替换构象Tr1中相应位置的片段,生成重组构象T′;
8)片段组装,过程如下:
8.1)从重组构象T′中随机选择一个窗口宽度为3的滑动窗口Wf,从与滑动窗口Wf相应的片段库中随机选择一个片段替换原有片段,生成构象T″;
8.2)利用Rosetta score3能量函数计算构象T′和T″的能量,并根据boltzmann准则决定片段组装是否接收;
8.3)若未接收,转至步骤8.1),重新进行片段组装;
9)loop区域采样,过程如下:
9.1)利用DSSP算法获取目标构象的二级结构,随机选择一个loop区域,记作[Lb,Le];从处理后的残基对距离中选取残基分别在该loop区域两侧的非loop结构的残基对,按照二级结构对该loop区域左右两侧的非loop区域进行排序,距离该loop区域越近权重越大,记(i1,i2)是第i对残基所在二级结构相对于选定loop区域的索引,若i1小于i2,权重否则,
9.2)根据选择出的距离残基对构建loop区域采样模型:
其中N为接触对的数量,为残基对(i,j)之间的Cβ原子距离,为预测的残基对(i,j)距离;
9.3)以[Lb,Le]中的二面角扰动量为变量,以最小化Dlocal_score为目标,利用差分进化算法求解10组扰动量;其中和分别表示第l个残基的二面角和ψ上的扰动量,l∈{Lb,Lb+1,…,Le};
9.4)用生成的10组扰动量分别对构象T″进行loop区域扰动,生成10个候选构象
10)构象更新,过程如下:
10.1)设i=1,其中i∈{1,2,...,10};
10.2)计算构象Tn和Ti*的Rosetta score3能量和Dscore,并根据距离势能的大小和boltzmann准则决定是否用Ti*替换Tn;若替换成功,转至步骤11);
10.3)i=i+1;若i≤10,转至步骤10.2);
11)n=n+1;若n≤NP,转至步骤6);
12)g=g+1;若g≤G,转至步骤5);
13)对最后一代蛋白质构象按照距离势能进行排序,以距离势能最小的构象作为预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010708524.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





