[发明专利]用于基因组分析的系统和方法在审
| 申请号: | 201680059045.3 | 申请日: | 2016-08-04 |
| 公开(公告)号: | CN108350494A | 公开(公告)日: | 2018-07-31 |
| 发明(设计)人: | A·奎罗兹扎拉特;R·奥利瓦雷斯-阿马亚;T·J·沃森;H·C·范阿格伦;E·克罗纳多斯洛卡;C·A·安古洛瑟美诺;F·芬布勒斯胡拉多;A·索利斯加西亚-印达;F·冯托夫赫雷拉;P·G·考斯特 | 申请(专利权)人: | 阿柯生物有限公司 |
| 主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;G06F19/00;G06F19/22 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 余颖;陈扬扬 |
| 地址: | 美国马*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 比对 变体 基因组分析 测序装置 遗传序列 检测 概率 | ||
本文提供了用于比对通过测序装置生成的原始遗传序列数据的方法。本文还提供了这样的方法和系统,其用于对一个或多个读数对的可能比对是正确的概率进行定量,用于识别已知变体,以及用于检测新型结构变体。
本申请要求2015年8月6日提交的的美国临时申请62/201,923的权益,其通过引用纳入本文。
背景技术
生物测序是确定诸如DNA、RNA、蛋白质和其它聚合物的生物分子内单体(例如,核苷酸或氨基酸)精确顺序的方法。测序方法和仪器的快速发展可以显著地促进生物医学研究。例如,下一代核酸测序技术可以提供一种低成本、高通量测序方法的范例。下一代测序技术可以使测序过程平行化,从而同时产生数千个或数百万个核苷酸测序,获得大量信息。测序的精度也可以通过下一代测序技术显著地增强。这样的技术可以使得研究人员在较短的时间内收集大量高精度序列数据。全基因组DNA和RNA序列已经成为基因测试和疾病诊断和治疗的常规程序。
通常,基因组数据可以存档于储存库中,例如,单独的储存库(例如,那些与生成基因组数据的实验室相关的)或公开序列储存库,其将从不同实验室收集的数据存档于中心储存库内。储存如此大容量的数据需要存储库具有具备巨大容量储存能力的大储存盘。此外,随着研究的进展,输入的基因组数据量也会增加,因此增加维护成本以及对额外储存空间的需求。而且,因为基因组数据可以用于进一步的参照,所以可以压缩形式存档基因组数据,从而允许在不损失任何信息的情况下解压缩和获取
本文公开了一种用于比对通过测序装置生成的原始遗传序列数据的方法,该方法包括:(a)获取通过测序装置生成的原始遗传序列数据;并且(b)将所述通过测序装置生成的原始遗传序列数据与基因组差异图谱(variation map)上的位置比对,其中基因组差异图谱包括选替路径(alternate path)。在一些实施方式中,映射通过图像比对(graphalignment)进行。在一些实施方式中,图像比对使用单一图像。在一些实施方式中,映射使用缺口比对(gapped alignment)进行。在一些实施方式中,映射使用半缺口比对进行。在一些实施方式中,还包括在映射步骤中累加选替路径(alternative path)中特定路径被映射的次数。
本文公开了一种对一个或多个读数对的可能比对是正确的概率进行定量的方法,其中计算了读数对子集的可能比对是正确的概率,将其作为正确比对个别读数的概率和用于观测读数对的比对特征的估计概率的函数,包括但不限于对齐的读数之间的距离和各对两个读数的比对方向。在一些实施方式中,基于子集中的一个或多个其它读数对(其可以是具有相同条形码的读数对)的比对特征,可以对一个或多个读数对的可能比对是正确的概率进行进一步的评分。
本文公开了一种对一个或多个读数的可能比对是正确的概率进行定量的方法,其中计算了读数子集的可能比对是正确的概率,将其作为个别读数的比对是正确的概率和观测子集中其它读数(其可以是具有相同条形码的读数)的比对特征的概率的函数。
本文公开了通过将图像参照比对与新型变体或结构变体检测结合来改善变体识别(variant calling)的系统和方法。用于检测变体的方法包括:a)获得多个序列读数,b)将其与图像参照比对,c)鉴定可以指示变异或结构变异存在的读数,并将其直接或间接的传递至变体识别器(caller)(例如,先写入文件)。在一些实施方式中,可以将新检测到的变体的子集自动添加到参照,并且然后可将更新的参照用于另一个比对。在一些实施方式中,在比对步骤进行(也就是,并非所有序列读数都已经比对了)并且被写入配置文件或传递至变体识别器时,鉴定指示变异或结构变异存在的读数的子集。以此方式,在变体识别之前不需要扫描全部对齐的读数的步骤。然后可以在图像参照比对进行时或之后进行新型变体检测步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿柯生物有限公司,未经阿柯生物有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680059045.3/2.html,转载请声明来源钻瓜专利网。





