[发明专利]一种基于子集错误率估计的肽鉴定方法有效

申请号：	201310375508.5	申请日：	2013-08-26
公开（公告）号：	CN103439441A	公开（公告）日：	2013-12-11
发明（设计）人：	付岩	申请（专利权）人：	中国科学院数学与系统科学研究院
主分类号：	G01N30/86	分类号：	G01N30/86;G01N30/72
代理公司：	北京君尚知识产权代理事务所(普通合伙) 11200	代理人：	余长江
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于子集错误率估计鉴定方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于蛋白质分析技术领域，具体涉及一种基于子集错误率估计的肽鉴定方法。

背景技术

众所周知，绝大多数生物的遗传信息保存在DNA中。DNA通过转录过程生成信使RNA，而信使RNA又通过翻译过程生成蛋白质，从而实现了遗传信息由DNA到RNA再到蛋白质的传递，这一过程也被称为生命的中心法则。在从RNA翻译生成蛋白质的过程中，20种氨基酸以肽键顺序相连所形成的链状分子被称为肽，而其中分子量达到一定级别的肽则被称为蛋白质。大多数蛋白质在翻译形成后，会在蛋白质中的某些氨基酸上增加某种功能团（如在蛋白质的N末端加入乙酰），或增加了其他的蛋白质或肽，或改变了氨基酸的化学性质或结构，这一过程被称为发生了化学修饰，由于该过程发生在前述的翻译过程后，因此在蛋白质氨基酸上所发生的变化也被称为蛋白质翻译后修饰。

液相色谱与质谱仪联用，并结合数据库搜索计算是目前蛋白质组学中鉴定蛋白质及其翻译后修饰的常用方法。在这种方法中，通过液相色谱与质谱仪联用可以得到蛋白质样品的实验串联质谱。实验串联质谱的获取过程包括：蛋白质样品首先被选定的蛋白酶水解，形成肽混合物；肽混合物通过液相色谱进行分离，不同物理化学性质的肽先后从色谱柱中流出；从色谱柱中流出的肽不断进入质谱仪；肽在质谱仪中被离子化，具有特定质量电荷比的肽离子在能量作用下碎裂形成碎片离子，碎片离子被分离和检测形成肽碎片离子谱；通过以上过程便得到蛋白质的实验串联质谱。在得到实验串联质谱后就可以从实验串联质谱中鉴定肽的氨基酸序列，进而鉴定蛋白质。

从实验串联质谱中鉴定肽的氨基酸序列时通常采用数据库搜索计算的方法。在计算过程中，数据库中所保存的蛋白质序列被模拟水解成候选肽，然后再将候选肽理论碎裂，生成理论串联质谱；将模拟计算得到的多个理论串联质谱依次与前述液相色谱与质谱仪联用所得到的实验串联质谱相比较，根据相似度进行打分，得分最高的理论质谱对应的肽就是实验质谱的鉴定结果。如果生成实验串联质谱的肽序列存在于数据库中的话，就可能将其鉴定出来。为了鉴定发生翻译后修饰的蛋白质，一种常见的基于串联质谱的鉴定方法是在数据库搜索时指定一些可变修饰类型，然后在生成候选肽时同时考虑发生和不发生指定修饰的情况，当候选肽中有多个可能的修饰位点时考虑所有可能的组合。

在基于质谱的蛋白质组学研究中，一次蛋白质组质谱实验通常能够产生数千至百万规模的串联质谱。通过数据库搜索鉴定这些质谱图，就产生了数目巨大的有待确认的肽鉴定结果。然而，由于谱图信号差、存在未知修饰、以及打分算法的缺陷等原因，这些结果的一部分（往往是大部分）是不正确的。所以，需要根据鉴定分值对鉴定结果进行过滤以及FDR（False Discovery Rate，中文可翻译为假发现率或者错误发现率，参见参考文献：Benjamini,Y.and Y.Hochberg,Controlling the false discovery rate:a practical and powerful approach to multiple testing.Journal of the Royal Statistical Society,Series B(Methodological),1995.57(1):p.289-300.）的估计和控制。目前最常用和有效的肽鉴定FDR估计方法是目标-诱饵库搜索方法（参见文献：Elias,J.E.and S.P.Gygi,Target-decoy search strategy for increased confidence in large-scale protein identifications by mass spectrometry.Nat Methods,2007.4(3):p.207-14.）。在这种方法中，通过搜索诱饵蛋白质序列（如目标库的反序列构成的数据库）来获得错误的鉴定，而FDR就用分值阈值之上的诱饵肽鉴定数量除以目标肽鉴定数量来估计。当鉴定数量较大时，这种目标-诱饵库搜索方法可以有效的估计肽鉴定FDR。但是如果鉴定数量较少的话，这种FDR估计方法就不准确了（参见文献：Huttlin,E.L.,et al.,Prediction of error associated with false-positive rate determination for peptide identification in large-scale proteomics experiments using a combined reverse and forward peptide sequence database strategy.J Proteome Res,2007.6(1):p.392-8.）。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院数学与系统科学研究院，未经中国科学院数学与系统科学研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310375508.5/2.html，转载请声明来源钻瓜专利网。

上一篇：单核增生李斯特氏菌富集和快速检测方法
下一篇：一种菌影载体的构建方法

同类专利

专利分类

G 物理

G01 测量；测试
G01N 借助于测定材料的化学或物理性质来测试或分析材料
G01N30-00 利用吸附作用、吸收作用或类似现象，或者利用离子交换，例如色谱法将材料分离成各个组分，来测试或分析材料
G01N30-02 .柱色谱法
G01N30-89 .反色谱法，即，被分析物在固定相中
G01N30-90 .平面色谱法，例如薄层或纸色谱法
G01N30-96 .利用离子交换
G01N30-91 ..样品的施加

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于子集错误率估计的肽鉴定方法有效

专利文献下载