[发明专利]用于高保真测序的方法和系统在审
申请号: | 201780007584.7 | 申请日: | 2017-01-20 |
公开(公告)号: | CN108603229A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 奥利弗·克劳德·维恩;亚历山大·蒂洛·狄尔泰 | 申请(专利权)人: | 格瑞尔公司 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;G06F19/12;G06F19/18;G06F19/22 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李平;郑霞 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 高保真 测序 测序数据 多个方面 连接条件 模型分析 假阳性 衔接子 杂合体 最小化 变体 产率 富集 系综 制备 文库 捕获 污染 突变 | ||
1.一种用于核酸测序的方法,所述方法包括:
获得样品中的核酸的多个测序读段;
鉴定包含具有共享起始坐标和读段长度的两个或更多个测序读段的系综;
确定所述样品中存在的对应于所述系综测序读段的原始输入分子的数量;
鉴定所述系综中的候选变体;和
使用概率模型和所确定的原始输入分子的数量来确定所述候选变体是真实变体的可能性。
2.根据权利要求1所述的方法,其中获得测序读段包括:
从所述样品制备测序文库;
扩增所述测序文库;和
使用下一代测序(NGS)将所述测序文库测序。
3.根据权利要求2所述的方法,其中所述制备步骤包括使用约16小时的反应时间、在约16摄氏度的温度将衔接子连接至所述核酸。
4.根据权利要求2所述的方法,其中所述扩增步骤包括PCR扩增,并且所述方法还包括使用计算机模型选择所需的过度扩增因子和PCR循环数目以检测样品中的指定浓度的变体。
5.根据权利要求2所述的方法,还包括:
基于包括鸟嘌呤-胞嘧啶(GC)含量、靶群体中的突变频率和序列独特性的因素设计靶向基因组区域的杂合体捕获组,和
在所述测序步骤之前使用所述杂合体捕获组捕获扩增的核酸。
6.根据权利要求5所述的方法,其中所述捕获步骤包括使用靶向靶基因座的有义链的第一杂合体捕获组和靶向所述靶基因座的反义链的第二杂合体捕获组。
7.根据权利要求2所述的方法,还包括在扩增所述测序文库之前将合成的核酸对照添加至所述样品,并且使用所述合成的核酸对照的测序读段确定错误率。
8.根据权利要求7所述的方法,其中所述合成的核酸对照包含已知序列,所述已知序列在所述核酸所来源的物种中具有低多样性,并且具有与所述已知序列的多于一个非天然存在的错配。
9.根据权利要求8所述的方法,其中所述多于一个非天然存在的错配是4个。
10.根据权利要求7所述的方法,其中所述合成的核酸对照包括代表所述杂合体捕获组的靶基因座的鸟嘌呤-胞嘧啶(GC)含量分布。
11.根据权利要求7所述的方法,其中所述合成的核酸对照包括包含与所述杂合体捕获组的下拉探针的不同重叠的多于一种核酸。
12.根据权利要求7所述的方法,还包括使用所述合成的核酸对照的测序读段确定错误率。
13.根据权利要求7所述的方法,还包括确定候选变体频率。
14.根据权利要求1所述的方法,其中所述核酸包括无细胞核酸。
15.根据权利要求2所述的方法,其中所述样品包括组织样品,其中获得测序读段还包括在所述制备步骤之前将所述核酸片段化。
16.根据权利要求15所述的方法,其中所述片段化步骤包括超声处理或酶促裂解。
17.根据权利要求1所述的方法,还包括在应用所述概率模型之前向所述候选变体应用确定性模型。
18.根据权利要求17所述的方法,其中所述确定性模型包括当在所述核酸的有义链和反义链两者上均未鉴定出候选变体时丢弃所述候选变体。
19.根据权利要求1所述的方法,其中所述概率模型是似然估计模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于格瑞尔公司,未经格瑞尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780007584.7/1.html,转载请声明来源钻瓜专利网。