[发明专利]测序文库的构建方法及用于测序文库构建的试剂盒在审
申请号: | 201410606175.7 | 申请日: | 2014-10-31 |
公开(公告)号: | CN104313699A | 公开(公告)日: | 2015-01-28 |
发明(设计)人: | 曹志生;王大伟;蒋智;李明洲;刘运超;朱海浩 | 申请(专利权)人: | 天津诺禾致源生物信息科技有限公司 |
主分类号: | C40B50/06 | 分类号: | C40B50/06 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;张永明 |
地址: | 301700 天津市*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序文 构建 方法 用于 试剂盒 | ||
技术领域
本发明涉及高通量测序领域,具体而言,涉及一种测序文库的构建方法及用于测序文库构建的试剂盒。
背景技术
基于限制性酶切位点相关DNA(Restriction-site Associated DNA,RAD)的测序技术,即RAD-seq技术是在二代测序基础上发展起来的一项基于全基因组酶切位点的简化基因组测序技术。该方法技术流程简单,不受有无参考基因组的限制,可大大简化基因组的复杂性,减少实验费用,通过一次测序就可以获得数以万计的多态性标记。目前,RAD-seq技术已成功应用于超高密度遗传图谱的构建、重要性状的精细定位、辅助基因组序列组装、群体基因组学以及系统发生学等基因组研究热点领域。
利用限制性内切酶对基因组DNA样品进行酶切。一般情况下,八碱基酶在基因组中出现的频率最低,其次是六碱基酶,出现频率最高的为四碱基酶。限制性内切酶的选择需要对目标物种的参考基因组进行系统分析,根据基因组的GC含量、重复序列情况等信息选择合适的酶。但是针对不同的酶我们需要设计不同的接头,来达到构建RAD文库的目的。
RAD-seq的主要实验流程如下:首先,对基因组进行酶切,然后在酶切后的基因组片段两端加上P1接头。然后将加好P1接头的序列进行打断。通过琼脂糖胶检测,选择符合大小的目的条带,一般选择目标条带在400~500bp。打断后的DNA片段连接上P2接头。对加过接头的DNA进行PCR扩增。其中,P1接头为带有酶切位点的粘性末端序列,且P1接头上还具有高通量测序所需的其他序列,比如P7序列、标签序列以及第二目的片段测序引物序列;本领域常用的P2接头是P5接头序列以及第一目的片段测序引物序列。
目前针对基于限制性酶切位点相关的DNA测序(RAD-seq)文库的构建方法中,酶的选择有很多种,比如识别序列为6碱基的酶:PstI(CTGCAG)和EcoRI(GAATTC);还有识别序列为8碱基的酶:SbfI(CCTGCAGG)等。根据基因组中每个位点都是A、T、C、G四种碱基中的其中一种,每个位点出现固定一个碱基的几率为1/4,这样4碱基,6碱基,8碱基酶的酶切位点在基因组上分布位点的间隔理论分别为:256bp,4096bp,65536bp。很显然,与八碱基酶SbfI相比,通过6碱基酶EcoRI、PstI的酶切能够产生更高密度的RAD标记。
在选择限制性内切酶时要根据物种基因组序列信息以及实验目的来选择,保证产生的RAD标记能够在基因组上均匀分布,同时所获得的RAD标记数量能够达到实验所需的饱和度。不同识别序列的酶在基因组上分布的密度也是不一样的,所得到的标记数目也是不一样的。同样数目识别序列的酶在小的基因组中标记数比基因组大的物种中要少。大的基因组比较适合识别序列多的酶,而在小的基因组中适合选识别序列少的酶。在大规模生产中,针对不同大小基因组的物种,我们可能需要选择不同识别序列个数的酶,但是针对不同的酶我们需要设计对应的接头,既浪费成本而且也不灵活。
因此,仍需要对现有的文库构建方法进行改进,以克服现有方法灵活性不够以及每次合成接头造成的成本浪费的缺陷。
发明内容
本发明的主要目的在于提供一种测序文库的构建方法及用于测序文库构建的试剂盒,以解决现有技术中在基于限制性酶切位点相关DNA的测序(RAD-Seq)文库构建时存在灵活性差、成本浪费的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种高通量测序文库的构建方法,该构建方法包括:对待测样本的基因组DNA进行酶切,得到具有粘性末端的酶切片段;在酶切片段的两端加P1接头,得到带P1接头片段;对带P1接头片段进行片段化,得到目标大小片段;以及在目标大小片段的两端加P2接头,得到高通量测序文库;其中,基因组DNA中包括能被酶识别的识别序列,识别序列包括由识别序列两端的碱基构成的回文序列以及位于回文序列中间的可变序列,可变序列包括一个或多个碱基,并且粘性末端包括可变序列中的一个或多个碱基。
进一步地,粘性末端包括可变序列中的至少3个碱基。
进一步地,上述酶为限制性内切酶AlwNI、DraIII、BglI、BstAPI或PflMI。
进一步地,P1接头与部分或全部酶切片段的粘性末端相适应。
进一步地,在酶的识别序列中,构成所述回文序列的碱基数是2n,n为≧2的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津诺禾致源生物信息科技有限公司,未经天津诺禾致源生物信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410606175.7/2.html,转载请声明来源钻瓜专利网。