[发明专利]一种蛋白质亚叶绿体多位置预测方法在审
| 申请号: | 201510782419.1 | 申请日: | 2015-11-12 |
| 公开(公告)号: | CN105447340A | 公开(公告)日: | 2016-03-30 |
| 发明(设计)人: | 王晓;张秋闻;赵进超;王榕;张伟伟;郭瑞 | 申请(专利权)人: | 郑州轻工业学院 |
| 主分类号: | G06F19/18 | 分类号: | G06F19/18;G06F19/24 |
| 代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张绍琳;张真真 |
| 地址: | 450002*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 蛋白质 叶绿体 位置 预测 方法 | ||
技术领域
本发明属于蛋白质亚细胞位置定位预测领域,尤其涉及一种融合位置间关系与位置相关特征的蛋白质亚叶绿体多位置预测方法。
背景技术
叶绿体(Chloroplast)是大部分绿色植物细胞中的细胞器,也存在于某些真核生物体中,如海藻。叶绿体的主要功能是执行光合作用,吸收存储太阳的光能,转化成化学能,并且释放氧气。除了光合作用外,它们也负责合成植物所需的几乎所有脂肪酸和参与植物的免疫反应。位于叶绿体中的蛋白质在这些生物过程中起到十分重要的作用,并且在不同的生物过程中扮演不同的角色,具有不同的功能。由于这些叶绿体蛋白质的功能和它们的亚叶绿体位置有十分密切的关系,因此首先识别出它们的亚叶绿体位置对于了解它们的功能很有帮助。
过去,研究人员主要专注于在细胞级别预测蛋白质的位置,提出了大量的方法。这些方法分别从以下4个方面推进了该领域的发展:
(1)不断拓宽了细胞位置的覆盖范围,使亚细胞位置预测工具的实用性大大增强。最早的一些工作仅覆盖很少的位置信息。例如,Nakashima等人(Nakashima,H.,Nishikawa,K.Discriminationofintracellularandextracellularproteinsusingaminoacidcompositionandresidue-pairfrequencies.JournalofMolecularBiology,1994,238(1):54–61)的研究仅仅覆盖了2个位置信息,Cedano等人(Cedano,J.,Aloy,P.,P'erez-Pons,J.A.,etal.Relationbetweenaminoacidcompositionandcellularlocationofproteins.JournalofMolecularBiology,1997,266:594-600)的工作覆盖了5个位置信息。随着越来越多的蛋白质数据可用,位置数量已经增加到了22个。
(2)大大提高了预测的准确率。研究人员主要从两个方面入手,一是从蛋白质序列中提取具有高度判别能力的特征,二是选用和开发泛化能力强大的分类器。对于特征提取,首先采用的是氨基酸组成,然后Chou(Chou,K.C.Predictionofproteincellularattributesusingpseudo-aminoacidcomposition.Proteins:Structure,Function,andBioinformatics,2001,43(3):246–255)又提出了伪氨基酸组成,加入了序列顺序影响。此后,基于Chou的伪氨基酸组成概念,大量的变体被开发出来,比如,考虑序列进化信息,功能域组成,基因本体信息。除了提取特征以外,大量的机器学习方法被应用到该领域,最常用的有kNN及其变体,SVM等。
(3)由于不同物种间蛋白质序列和细胞位置间的差异,比如,叶绿体只存在于植物细胞中,而人类等其他动物细胞中却没有,因此,有必要为不同的物种开发专门的预测器,以避免得到无意义的预测结果。目前,已经出现不少的物种专有的预测器,以Chou和Shen开发的Cell-Ploc(Chou,K.C.,Shen,H.B.Cell-PLoc:apackageofWebserversforpredictingsubcellularlocalizationofproteinsinvariousorganisms.NatureProtocols,2008,3(2):153-162)最为著名。
(4)研究表明,有大量的蛋白质定位于多个细胞位置,参与执行不同的生物功能,这些蛋白质对于制药工程和基础研究有很重要的意义。因此,开发出能够预测多个细胞位置的方法将十分必要。已经有一些方法可以用于预测蛋白质的多亚细胞位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院,未经郑州轻工业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510782419.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





