[发明专利]用于处理基因组数据的方法在审
申请号: | 201280005927.3 | 申请日: | 2012-01-19 |
公开(公告)号: | CN103329138A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | V·V·马卡帕蒂;N·迪米特罗娃;R·辛格;S·K·亚格兰 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 左路;林晓红 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 基因组 数据 方法 | ||
技术领域
本发明涉及一种处理受试者的基因组数据的方法,包括(a)获得受试者的基因组序列;(b)降低基因组序列信息的复杂性和/或量;以及(c)以能够快速检索的形式存储步骤(b)的基因组序列信息。本发明还涉及一种方法,其中,通过剪切除与疾病或失调相关的特征数据之外的基因组序列信息,或通过将受试者的基因组序列与包括与疾病或失调相关的特征数据的参考序列比对,来执行降低基因组序列信息的复杂性和/或量的步骤。此外,本发明涉及还涉及这样的方法,其中,包括利用受试者的功能遗传信息,尤其是基因表达数据;以及涉及这样的方法,其中,基于马尔可夫链过程将信息编码为矩阵并对其进行解码和表达。也可以将获得的信息用于诊断、检测、监测或预后疾病和/或用于制备受试者的分子历史。此外,提供了相应的临床决策支持和存储系统,优选形式为电子图片/数据存档及通信系统。
背景技术
随着新的或者下一代测序技术的引入,获得序列信息的成本以及提供这一信息所需的时间已经急剧下降,并且未来将进一步降低。因而,全基因组测序正在逐渐变为现有的生物化学和遗传测试及化验的经济有效的替代。此外,可以将患者的全基因组序列用于不只一种机能紊乱的分析,还可以将其用于整个疾病基因型组的评估,此外其还允许推断处置前景,因为其同时阐明了所有可能的次级标记(secondary marker)。然而,基因组序列数据极为庞大,需要巨大的存储容量,并且需要高端计算设备对其进行分析。例如,Schuster等人在2010,Nature 463(18),943-947页,以及Fujimoto等人在2010,Nature Genetics,42,931-936页提供了分别来自非洲和日本个体的猎人-采集人的完整基因组的信息。这些分析提供了关于单核甘酸变异、人类种群之间的种群差异以及等位基因频率的存在的过量的新信息。遇到的基因组差异和相似性对于基因组领域中的基础研究而言可能极为重要。不过,专业人员对它们仅有较小兴趣,专业人员关注的是具体临床问题,并希望能有关于所识别的症状或疑似疾病的集中的信息。在这种背景下,在整个基因组测序轮次期间获得的大多数基因组序列数据将会妨碍专业人员的诊断可能,而不是改善其诊断可能。
于是,需要一种方法,其允许对患者的基因组数据进行节省时间和资源的处理。
发明内容
本发明解决了这种需求并提供了若干手段和方法,其允许减小受试者基因组序列的复杂性和/或量并且以能够快速检索的形式存储它。
以上目标尤其是通过用于处理受试者基因组数据的方法实现的,该方法包括如下步骤:
(a)获得受试者的基因组序列;
(b)减小基因组序列信息的复杂性和/或量;以及
(c)以能够快速检索的形式存储步骤(b)的基因组序列信息。
这种方法提供了如下优点,即基因组信息变得容易并以集中和已处理方式被专业人员或医生访问,即基因组信息可以管理并限于必要的事实,因此允许以节省时间和资源的方式处理极大量的原始序列数据。以能够快速检索的形式存储进一步允许迅速、即时和局部不受限和独立的使用,例如在问题临床环境中、在流动医院中或在患者的床边等。
在本发明的优选实施例中,基因组序列是从受试者的样本获得的。
在另一优选实施例中,要分析的样本是组织、器官、细胞的混合物。样本还可以,或者者可选地,包括组织、器官或细胞的碎片。在另一实施例中,样本可以是组织或器官特异性的样本。特别优选的是来自阴道组织、舌头、胰腺、肝脏、脾脏、卵巢、肌肉、关节组织、神经组织、胃肠组织、肿瘤组织、体液、血液、血清、唾液或尿液的组织活检样本。
在本发明的另一特别优选的实施例中,可以重复获得受试者基因组序列的步骤,例如,在一定时间之后。
在本发明的另一优选实施例中,重复获得受试者的基因组序列可能导致数据增加或变化,其中,优选以能够快速检索的形式存储与先前获得的基因组序列信息相比的增量数据。
在本发明的另一特别优选的实施例中,可以通过剪切所述基因组序列信息来进行减小基因组序列信息复杂性和/或量的步骤。优选对除与疾病或失调相关的特征数据(signature data)之外的基因组序列的所有部分进行这样的剪切或减小步骤。
在本发明的又一特别优选的实施例中,可以通过将受试者的基因组序列与包括与疾病或失调相关的特征数据的参考序列(疾病参考序列)比对来进行减小基因组序列信息复杂性和/或量的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280005927.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像检索装置和方法、图像处理装置和方法
- 下一篇:一种装饰板用隧道式烘箱
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置