[发明专利]基于最近邻算法的蛋白激酶特异性预测方法及装置在审
申请号: | 201310676124.7 | 申请日: | 2013-12-11 |
公开(公告)号: | CN103745135A | 公开(公告)日: | 2014-04-23 |
发明(设计)人: | 周丰丰;赵苗苗;张召;罗幼喜;麦国琴 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 沈祖锋;郝明琴 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 近邻 算法 蛋白激酶 特异性 预测 方法 装置 | ||
【技术领域】
本发明涉及蛋白质修饰化位点识别技术领域,具体涉及一种基于最近邻算法的蛋白激酶特异性预测方法及装置。
【背景技术】
蛋白质磷酸化和去磷酸化作用在多种真核细胞中具有重要作用,例如调节着细胞信号转导、细胞分化、细胞生长、细胞凋亡等几乎所有生命活动。蛋白激酶(protein kinases,PKS)在蛋白底物中催化特定的受体氨基酸,每一种激酶只催化特定的底物。蛋白质磷酸化位点主要发生于酪氨酸(Y)、丝氨酸(S)与苏氨酸(T)残基(Wu et al.,J Proteome Res,2007,6(5):1812)。蛋白质磷酸化的异常往往导致细胞生命活动的异常,甚至产生细胞损伤或细胞癌变(Yang et al.,J Proteome Res,2006,5(5):252)。因此,了解特定蛋白激酶的磷酸化作用机制将会影响当前分子生物学的许多领域,对疾病的相关研究以及药物设计等方面有很多的帮助。
现有技术中测定磷酸化位点的方法,主要包括实验手段、质谱分析、缩氨酸微阵列和特定磷蛋白水解。实验手段鉴定激酶特异性磷酸化位点是了解磷酸化机制以及药物设计的基础。目前已发展多种实验鉴定蛋白质磷酸化位点方法,传统鉴定方法如P32标记法和埃德曼降解法常用于磷酸化位点测定(Campbell et al.,J Biomol Tech,2002,13:119),但其费时、费力、灵敏度低以及需要大量提纯蛋白质,还会被酶反应所抑制。基于质谱高通量磷酸化位点鉴定方法是最近涌现出的检测蛋白磷酸化强有力手段(Philip et al.,Cell Commun Adhes,2006,13:249),但该类方法大多仍处于实验室研究阶段未得到广泛应用。随着高通量鉴定蛋白质磷酸化技术发展,特别是质谱技术在蛋白组学上应用,磷酸化位点的数据不断积累,已有多种计算机预测方法预测磷酸化位点,如遗传算法-神经网络(Tang et al.,Protein Engineering.Design&Selection,2007,20(8):405),支持向量机(Kim et al.,Bioinformatics,2004,20:3179),隐Markov模型(Huang et al.,Nucleic Acids Res,2005,33:W226)及贝叶斯决策理论(Xue et al.,BMC Bioinformatics,2006,7:163)等。缩氨酸微阵列(peptide microarray)和特定磷蛋白质水解(phosphor-specific proteolysis)在分析磷酸化蛋白质组,产生了大量酵母、鼠类、人类和植物的数据,但是在识别基于不同底物的蛋白激酶磷酸化位点仍然十分困难。
而基于计算手段的磷酸化位点预测可以提供快速、自动的标注。目前,consensus序列、信息超二级结构模块、功能模块以及特定氨基酸都已被用于磷酸化位点的预测。这些方法的一个共同缺点是不能提供相应的蛋白质激酶信息。
现有的磷酸化位点预测方法都存在无法同时获得较高灵敏度和特异性的问题,并且预测正确率仍然不高,因此有必要开发具有高灵敏度、特异度和预测正确率的蛋白激酶磷酸化特异位点识别方法。
【发明内容】
本发明的目的在于克服上述不足之处,提供一种基于最近邻算法的蛋白激酶特异性预测方法,解决现有技术中灵敏度、特异性以及预测正确率不高的技术问题。
为此,本发明提供以下技术方案:
本发明提供了一种基于最近邻算法的蛋白激酶特异性预测方法,用于对不同蛋白激酶家族的磷酸化作用位点进行标注,包括:
步骤1:从磷酸化数据库中提取蛋白激酶特异性的磷酸化位点数据,构建用于激酶识别的数据集;
步骤2:将所述数据集中每个磷酸化位点提取磷酸化位点肽段数据,所述磷酸化位点肽段以磷酸化位点为中心、包括所述磷酸化位点上游、下游各n个氨基酸残疾;
步骤3:将经实验验证的磷酸化位点的磷酸化位点肽段数据组成阳性数据集,将未经实验验证的磷酸化位点的磷酸化位点肽段数据组成阴性数据集;
步骤4:将待测磷酸化位点肽段与所述阳性数据集或/和所述阴性数据集中的每一个已知磷酸化位点肽段进行序列对比,用氨基酸置换矩阵对所述待测磷酸化位点肽段和所述已知磷酸化位点肽段的相似性打分,将待测磷酸化位点肽段标注为得分最高的已知磷酸化位点肽段。
优选地,所述步骤1中磷酸化数据库为Phospho.ELM9.0。
优选地,所述步骤2中的n=7,磷酸化位点肽段含有15个氨基酸残基。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310676124.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用