[发明专利]处理蛋白质肽数据的方法和系统无效
申请号: | 200810097019.7 | 申请日: | 2008-05-08 |
公开(公告)号: | CN101303713A | 公开(公告)日: | 2008-11-12 |
发明(设计)人: | 尼古劳斯·贝恩泰尼斯;克里斯蒂安·米斯;贝恩德·穆勒 | 申请(专利权)人: | F·霍夫曼-拉·罗奇股份有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 刘晓东;顾晋伟 |
地址: | 瑞士*** | 国省代码: | 瑞士;CH |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 蛋白质 数据 方法 系统 | ||
1.一种处理从供分析的健康样本或病理样本获得的蛋白质肽数据 的方法,该方法包括以下步骤:
(a)提供代表输入数据集的肽序列列表和相关辅助信息;
(b)通过除去所述肽序列列表中的肽序列冗余而从所述输入数 据集编辑新的肽序列列表,所述新的肽序列列表代表肽数据集;和
(c)将源自同一蛋白的肽数据集的成员分组在一起,由此生成 蛋白质数据集。
2.根据权利要求1的方法,其中所述辅助信息包括以下至少一种: 对应的度量值、源蛋白质、所述肽的物理化学性质、所述肽在所述 蛋白质序列中的偏移。
3.根据权利要求1或2的方法,其中在步骤(b)中,在所述新的 肽序列列表中用单一项代表肽冗余。
4.根据权利要求3的方法,其中通过考虑全部冗余肽序列的所述 对应值来计算所述单一项的肽度量值。
5.根据前述权利要求中任一项的方法,其中步骤(c)包括基于每 种蛋白质的每个肽的测量值来计算每种蛋白质的总蛋白质度量。
6.根据前述权利要求中任一项的方法,其还包括将所述输入数据 集、蛋白质数据集和肽数据集存储在关系型数据库中。
7.根据权利要求6的方法,其中将每个肽序列映射至一个唯一编 号,并且一种蛋白质的肽的所述唯一编号之总和为每种蛋白质提供 唯一识别编号。
8.根据权利要求7的方法,其中基于所述唯一识别编号来分组。
9.根据前述权利要求中任一项的方法,还包括使所述数据集中的 至少一些数据集直观化。
10.根据前述权利要求中任一项的方法,还包括:
确定蛋白质数据集内共用相同肽的蛋白质并将其分组,由此形 成蛋白质分组数据集,并由此检测所述蛋白质集中的冗余。
11.一种方法,其包括以下步骤:
(a)提供与健康或病理组织相关的至少两个肽数据集或蛋白质 数据集;
(b)合并所述肽数据集或蛋白质数据集以生成复合数据集;和
(c)输出所述复合数据集。
12.根据权利要求11的方法,其中将健康组织的肽数据集或蛋白质 数据集与健康组织的其它肽数据集或蛋白质数据集合并。
13.根据权利要求11的方法,其中将病理组织的肽数据集或蛋白质 数据集与病理组织的其它肽数据集或蛋白质数据集合并。
14.根据权利要求11的方法,其中将健康组织的肽数据集或蛋白质 数据集与病理组织的肽数据集或蛋白质数据集合并。
15.根据权利要求11~14中任一项的方法,其中根据布尔运算规则 及其组合来实施步骤(b)中的所述合并。
16.根据权利要求11~15中任一项的方法,其中在合并步骤中,计 算每个成员蛋白质或成员肽的所述各种度量以包括来自每个原始 数据集的贡献。
17.根据权利要求11~16中任一项的方法,还包括将第一复合数据 集与至少一个其它复合数据集合并以生成更高等级的复合数据集。
18.根据权利要求11~17中任一项的方法,其中通过以下步骤获得 所述肽数据集:提供代表输入数据集的肽序列列表和相关辅助信 息;和通过除去所述肽序列列表中的肽序列冗余而从所述输入数据 集编辑新的肽序列列表,所述新的肽序列列表代表肽数据集。
19.根据权利要求11~17中任一项的方法,其中通过以下步骤获得 所述蛋白质数据集:提供代表输入数据集的肽序列列表和相关辅助 信息;通过除去所述肽序列列表中的肽序列冗余而从所述输入数据 集编辑新的肽序列列表,所述新的肽序列列表代表肽数据集;和将 源自相同蛋白质的肽数据集成员分组在一起,由此生成蛋白质数据 集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于F·霍夫曼-拉·罗奇股份有限公司,未经F·霍夫曼-拉·罗奇股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810097019.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电路板安装型电连接器
- 下一篇:用于使高比重卤水增稠的组合物以及方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置