[发明专利]一种判断蛋白质分子间生理属性相似性的方法无效
申请号: | 200710100354.3 | 申请日: | 2007-06-08 |
公开(公告)号: | CN101086503A | 公开(公告)日: | 2007-12-12 |
发明(设计)人: | 刘鑫;赵亚溥 | 申请(专利权)人: | 中国科学院力学研究所 |
主分类号: | G01N33/68 | 分类号: | G01N33/68;G06F17/00 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 | 代理人: | 尹振启 |
地址: | 100080北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 判断 蛋白质 分子 生理 属性 相似性 方法 | ||
1、一种判断蛋白质分子间生理属性相似性的方法,包括以下步骤:
1)利用已知的传统序列比对方法对蛋白质进行初选,得到一组属性可能相近似的蛋白质组,并选取该组中的蛋白质分子序列段;
2)每个蛋白质分子内部由氨基酸间复杂的疏水作用构成了一个蛋白质分子的疏水框架,计算上述各个蛋白质分子序列段的疏水框架相似性,进而,在相似的疏水框架上,各位点处残基可发生相应的改变,以此来判断蛋白质分子间生理属性相似性。
2、根据权利要求1所述的方法,其中步骤2)具体包括:
1)将每条蛋白质序列段顺序划分为m个字母的字段链单元,相邻的m字母字段链单元相错位一个字母,每条蛋白质得到L-(m-1)个m字母字段链单元,其中,L为一条蛋白质序列段的总长度;
2)将m字母字段链单元中的每个字母作为一个顶点,并将任意两个顶点相连形成线段,计算表示疏水框架特性的各线段的疏水力,并按此法得到组中所有m字母字段链单元中各线段的疏水力,其中疏水力Fnkij由下列公式给出:
其中n为蛋白质序列段的序列号,k为某一蛋白质序列段中m字母字段链单元的序号,i、j为顶点号,且1<=i<j<=m,a为氨基酸残基疏水性特征参数,h表示疏水,p表示亲水;
3)计算蛋白质组中所有i、j相同的线段的疏水力分别为1、0、-1的线段数各自占总线段数的本底比例Q1、Q0、Q-1;
4)分别计算整组中序号k相同、且i、j相同的线段的疏水力为1、0、-1的线段数,并得出各自占蛋白质总数的线段比例P1、P0、P-1;
5)计算一个蛋白质序列中每个m字母字段链单元中各线段的权重Dkij,其值由下式给出:
Dkij=|P-Q|
其中P、Q根据该线段的疏水力值Fnkij分别选取相对应的线段比例值P1、P0、P-1和本底比例值Q1、Q0、Q-1;
6)对于一个m字母字段链单元,计算任一可连接m顶点的(m-1)线段的权重和,并选取其中的最大值Sk;
7)对每个蛋白质的L-(m-1)个Sk值进行平均,得到每个蛋白质的平均权重和值S’n,其中S’n由下式给出:
S’n=ΣkSk/Σk;
8)将各蛋白质序列根据值S’n降序排列,选取S’n值低的几条序列重新计算Q,其它序列用于重新计算P,重复步骤5-8直至收敛;
9)最后得到蛋白质排列图,并根据设定的阙值,判断出生理属性相似的蛋白质序列。
3、如权利要求2所述的方法,其中蛋白质分子序列段初选后的各个步骤是通过计算机程序执行的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院力学研究所,未经中国科学院力学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710100354.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:永动机
- 下一篇:由地面向下贯通地下矿层的预建常设性救生管道及其设备