[发明专利]一种提高基因低频突变检测灵敏度的扩增子文库构建方法在审
申请号: | 201710382858.2 | 申请日: | 2017-05-26 |
公开(公告)号: | CN107058310A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | 易建明;屈武斌;蔡万世;王瑞超;杭兴宜 | 申请(专利权)人: | 艾吉泰康生物科技(北京)有限公司 |
主分类号: | C12N15/11 | 分类号: | C12N15/11;C12Q1/68;C40B50/06 |
代理公司: | 北京汇知杰知识产权代理事务所(普通合伙)11587 | 代理人: | 蔡伦 |
地址: | 102206 北京市昌平区北京市中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 基因 低频 突变 检测 灵敏度 扩增 文库 构建 方法 | ||
技术领域
本发明属于高通量测序领域,具体而言,本发明涉及一种提高基因突变检测灵敏度的扩增子文库构建方法。
背景技术
扩增子捕获测序技术是一种靶向捕获测序技术,主要利用多重PCR技术同时对多个目标区域序列进行特异性扩增和富集,得到扩增子文库,然后采用二代测序技术对扩增子文库进行测序,从而获取目标区域的序列信息。扩增子捕获测序技术因组合(panel)设计灵活、通量高、经济快速等优势,已经成为靶向捕获测序领域的主流技术,广泛应用于生物基础研究和临床疾病诊断。
尽管扩增子捕获测序技术应用广泛,但是它在基因低频突变检测领域的表现却差强人意,检测结果易出现假阳性,因此面临着严峻挑战。大量研究结果表明,出现假阳性的结果主要由以下两个原因造成:第一,Illumina测序平台测序过程中单个碱基的读取错误率为0.2%,DNA聚合酶引入错误碱基的错误率为10-7-10-5,基于此原因,扩增子捕获测序技术检测突变基因的灵敏度约为1%;第二,肿瘤gDNA或者ctDNA,因为含有大量异质性的DNA,导致突变基因的占比极低,突变频率通常介于0.01%-1%之间。因此,扩增子捕获测序技术因检测灵敏度低于目标位点突变的频率,导致检测结果极易出现假阳性。为了解决该问题,科研人员借鉴液相捕获测序技术解决该问题的思路,在目标区域序列与测序接头序列(adapter)之间引入一段12个简并碱基组成的条码序列(barcode),作为分子标签来辨别真正的自然突变,力求提高检测的灵敏度,降低假阳性。相关实验结果显示,该策略的确提高了检测的灵敏度,但是由于12个简并碱基的存在,导致引物序列之间互补配对形成大量的引物二聚体以及非特异性扩增条带,致使文库的测序质量下降、比对率下降、捕获率下降、均一性下降、测序噪音增加、测序成本增高,反而制约了扩增子捕获测序技术在该领域的应用。
因此,基因低频突变检测领域急需灵敏度更高的扩增子捕获测序技术。
发明内容
为了解决现有技术存在的问题,本发明改进了条码序列引入到扩增子文库的方式,提供了一种提高基因低频突变检测灵敏度的扩增子文库构建方法。该方法在提高基因突变检测灵敏度的同时,仍然可以保持扩增子文库的通量高、覆盖率高、捕获率高、均一性好等优势。
本发明的内容包含两个方面,第一方面是设计了一种用于扩增子文库扩增和富集时使用的多重上游发卡结构引物,所述引物从3’端至5’端包括序列A1-A7:
A1序列为特异性序列,与目标区域序列互补配对,引发扩增子的特异性扩增和富集;
A2序列为发卡结构的稳定序列,由两个以上连续的C和G碱基构成;
A3序列为5’端A7序列的反向互补序列;
A4序列为发卡结构的去稳定序列,碱基个数为2-8个,碱基序列中A和T多于G和C;
A5序列为条码序列,由8-16个简并碱基构成;
A6序列为测序接头序列;
A7序列为5’端序列,与A3序列反向互补;
A3和A7互补配对,形成所述多重上游发卡结构引物的茎结构;
A4、A5和A6形成所述多重上游发卡结构引物的环部分。
在优选实施方案中,所述A1特异性序列依照引物设计原则进行设计。
在优选实施方案中,在所述A2序列中,稳定序列通常由两个以上连续的C和G碱基构成,但碱基的个数和序列不受限制,优选20个以下,更优选10个以下,最优选5个以下。
在优选实施方案中,A3序列和A7序列形成局部双链的5’端可以为单链,也可以为封闭的双链(在局部双链的5’端为封闭的双链的情况下,A2序列与A7序列的5’端互补),所述双链为所述多重上游发卡结构引物的茎部分。A3和A7形成局部双链的碱基和个数没有要求,但是局部双链结构在55℃-67℃,例如59-64℃之间稳定,优选62℃时稳定,在70℃-78℃,例如70-76℃之间解链,优选71℃-74℃时能够解链为单链。
在优选实施方案中,在所述A4序列中,去稳定序列的碱基个数通常优选为2-4个,碱基序列中A和T多于G和C,优选全部为A或T。
在优选实施方案中,在所述A5序列中,条码序列通常由12个碱基(NNNNNNNNNNNN,N表示A、T、G、C中的任何一种)序列构成,但是碱基的个数可以根据扩增子的通量进行增减。
在优选实施方案中,所述A6序列是Illumina测序接头P5序列的全长序列或去除部分5’序列的Illumina测序接头P5序列。
在优选实施方案中,所述A7序列可以是A6序列5’的部分序列,或者是其他序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾吉泰康生物科技(北京)有限公司,未经艾吉泰康生物科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710382858.2/2.html,转载请声明来源钻瓜专利网。