[发明专利]使用经破碎的核苷酸的高通量多重测序确定基因拷贝数有效
| 申请号: | 201680063882.3 | 申请日: | 2016-09-08 |
| 公开(公告)号: | CN108603190B | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 迈克尔·H·魏格勒;丹·利维;王自华 | 申请(专利权)人: | 美国冷泉港实验室 |
| 主分类号: | C12N15/10 | 分类号: | C12N15/10;C12P19/34 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张晶;赵赫 |
| 地址: | 美国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 破碎 核苷酸 通量 多重 确定 基因 拷贝 | ||
本发明提供了SMASH(短多重聚合序列同源性),其是一种设计用于将多个独立的映射包含在每个读段中的技术。具体而言,本发明涉及一种组合物,所述组合物包含不同嵌合基因组核酸片段的第一混合物,其中所述混合物中的不同片段各自包含随机连接的DNA区段,其中片段中的每个DNA区段是长度为至少27个碱基对的核酸分子,由单个基因组的随机片段化产生。本发明还涉及产生所述组合物的方法和所述组合物用于获得诸如拷贝数变异的基因组信息的用途。
本申请要求于2016年2月5日提交的第62/292,151号美国临时申请、于2015年11月3日提交的第62/250,405号美国临时申请以及于2015年9月8日提交的第62/215,540号美国临时申请的优先权,它们的内容通过引用并入本文。
在本申请全文中,引用了各种出版物,包括在括号中引用的那些。对在括号中引用的出版物的完整引用可以在权利要求书之前的说明书末尾找到。所有引用的出版物的公开内容全部通过引用并入到本申请中,以更全面地描述本发明所属领域的状态。
背景技术
在基因组尺度上分析拷贝数变异体(CNV)可用于评估癌症进展和鉴定先天性遗传异常。CNV通常通过微阵列杂交鉴定,但也可以通过下一代测序(NGS)检测(Alkan等,2009;Sudmant等,2010)。这通常使用测量映射(mapping)到特定区域的序列读段(reads)的数量的算法来完成。因此,基于序列的拷贝数方法的分辨率在很大程度上取决于独立映射的数量。
下一代测序技术目前的趋势是增加每单位成本读取的碱基数量。这通过增加流动池中每条泳道的序列读段总数以及增加每个读段中的碱基数来完成。由于拷贝数测定方法的准确性是由独立读段的数量决定的,增加的序列读段长度不会提高拷贝数分析的分辨率。大部分基因组被短的读段很好地映射,短的读段大约25-30个碱基对(bp)。目前,高通量测序仪正在产生约150bp的读段长度,远远超过了满足唯一映射所需的读段长度。
发明内容
为了利用不断增加的读段长度,SMASH(短多重聚合序列同源性,
使用具有时效性的内存密集型映射算法处理由SMASH产生的嵌合序列读段,该算法将长的片段读段保守划分为组成型区段映射序列(map)。在下游拷贝数分析中以与使用读段映射序列相同的方式使用该区段映射序列。对于150-bp双末端读段,目前为止最具成本效益的测序平台的全基因组测序(WGS)平均数小于每读段对一个映射序列,而SMASH平均数4。SMASH映射序列的质量,即由样品制备、序列仪和映射偏差引入的不一致性,与WGS映射所观察到的不一致性具有相同的数量级。使用对WGS数据最有利的修正和测试方案时,基于映射的SMASH被证明能以WGS几分之一的成本产生与WGS具有几乎同等质量的拷贝数据。
附图说明
图1.SMASH方法和尺寸分析的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国冷泉港实验室,未经美国冷泉港实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680063882.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:突变根霉属菌
- 下一篇:分子克隆提取和验证方法





