[发明专利]一种DNA文库及其制备方法、一种DNA测序方法和装置有效

专利信息
申请号: 201010591448.7 申请日: 2010-12-16
公开(公告)号: CN102534811A 公开(公告)日: 2012-07-04
发明(设计)人: 吴逵;阿叁;耿春雨;张秀清;杨焕明 申请(专利权)人: 深圳华大基因科技有限公司;深圳华大基因研究院
主分类号: C40B40/02 分类号: C40B40/02;C40B50/06
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 程泳
地址: 518083 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 dna 文库 及其 制备 方法 装置
【说明书】:

技术领域

发明属于分子生物学领域,涉及一种DNA文库及其制备方法、一种DNA测序方法和装置。

背景技术

新一代测序技术(Next Generation Sequencing,NGS)又称为高通量测序技术,可一次同时对数百万条DNA进行测序,是DNA测序技术的一次革命。目前应用较广泛的主要有Illumina公司的GenomeAnalyzer系统(即Solexa测序仪,后又发展为HiSeq 2000系统)、ABI公司的SOLiD系统以及Roche 454公司的GS-FLX系统三大测序平台。

新一代测序技术产生的数据通量大,使得大规模基因组测序成为可能。但是目前高通量测序技术产生的序列读长与传统的Sanger法测序(如ABI 3730xl)比相对短很多,只有不到200bp,这对基于鸟枪法(Shotgun)测序的基因组组装来说是不利的。鸟枪法测序的原理是将基因组DNA片段化,产生一系列短的DNA片段,并对这些片段进行测序,获得序列信息后通过相互重叠关系将这些“碎片”序列组装成相对完整的序列。但是如果这些“碎片”序列是由重复片段(串联重复或反向重复)组成,则会因无法精确定位到基因组的某一位置,对序列组装造成困难,如此便导致基因组组装过程中重复序列区域形成“空洞”,更可能增加前后片段连接、组装的不确定性。

解决这一问题需要借助长片段测序。然而受测序技术所限,1kb以上的长片段测序难以实现,但是可以利用新一代测序技术高通量的特点,通过构建具有较大跨度的末端配对文库来解决这一问题。这种文库的特点是测序得到的序列是由一段较长插入片段的两个末端的序列组成,其间距和方向均为已知,由于这两段末端序列在基因组上具有较大的跨度,可以跨过上述重复序列区域,从而辅助组装的进行。这种测序策略即为配对末端测序,这一类型文库称为末端配对测序文库(Michael W.Smith et al.,Genomic sequence sampling:a strategy for high resolution sequence-based physical mapping of complex genomes.Nature Genetics 1994,7:40-47.)。末端配对文库对于短读长测序技术来说,其重要性在于能够有效将短的序列重叠群(contig)组装成较大的架构(scaffold),这对于像人或果蝇这种相对较大而复杂的基因组组装来说是一关键突破(Myers EW,et al:A whole-genome assembly of Drosophila.Science 2000,287(5461):2196-2204.)。

但是构建长插入片段,尤其是片段达到20kb甚至40kb以上时,末端配对文库的构建显得比较困难。一种方法是通过构建fosmid克隆,获得40kb左右的插入片段,然后对其末端进行测序。Tuzun等人即是利用这种方法,从高密度fosmid文库得到的110万个配对末端序列(paired-end sequences)与人类参考基因组(human genome reference assembly)进行比对,在长度或方向上不一致的区域被确定为插入、缺失和倒置(Tuzun E et al,2005.Fine-scale structural variaton of the human genome.Nat Genet 37:727-732.)。但是通过构建fosmid克隆实现这种大跨度序列的末端测序具有明显的局限性,宿主细胞中Fosmid载体拷贝数很低,这将限制微生物宿主细胞中特定基因序列扩繁的合成,重置等,同时在高通量测序平台的背景下,完成数十万乃至上百万fosmid克隆的制备,耗时长、成本高,不利于大规模文库的制备和测序。

WO 2007 145612A1中公开了另一种大片段末端的测序方法,其利用IIS型内切酶MmeI,在大片段末端产生出大约20个碱基的标签,环化之后,分离出含有双末端的片段,可以利用第二代测序技术进行测序。但是20个碱基对于复杂基因组来说太短,不能特异性的定位在基因组中,增加了数据处理的难度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技有限公司;深圳华大基因研究院,未经深圳华大基因科技有限公司;深圳华大基因研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010591448.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top