[发明专利]检测基因组目标区域多态性位点的方法及 系统有效
申请号: | 201010270464.6 | 申请日: | 2010-09-02 |
公开(公告)号: | CN101914628A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 李英睿;余昶;罗锐邦;张帆 | 申请(专利权)人: | 深圳华大基因科技有限公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;G06F19/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 刘震 |
地址: | 518083 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 基因组 目标 区域 多态性 方法 系统 | ||
技术领域
本发明涉及生物技术领域,尤其涉及一种检测基因组目标区域多态性位点的方法及系统。
背景技术
随着人类基因组计划和国际单体型图计划的胜利完成,生物学家通过遗传连锁或关联分析已经定位了大量与人类疾病相关的基因组候选区域,然而识别这些区域中的致病基因或突变需要对这些区域进行重新测序。
如果采用现有的全基因组重测序分析技术,其成本较高;而且对于针对候选区域等部分的研究、或者对于个体医疗给出有针对性的指导来说,全基因组重测序分析的结果包含大量冗余信息,不利于高效率地得出较为准确的研究成果。
为了提高获得有效信息的效率,将现有基因分析技术集中在高价值的基因研究区域对于科学研究和医疗指导具有重大意义。而且,传统的基于PCR(聚合酶链式反应,Polymerase Chain Reaction)来对候选区域进行测序的方法,费时费力,已经无法满足研究者的要求;同时基于基因芯片的SNP(单核苷酸多态性,Single Nucleotide Polymorphism)分型技术也无法找出基因组上的稀有变异。
随着新一代高通量测序技术(如Solexa测序技术)的出现以及测序成本的降低,使得高通量,低成本测序成为可能。研究者迫切需要一种可以对基因组上任意感兴趣的区域进行测序从而可以识别该区域上各种突变的技术。
由于基因编码区的突变是导致疾病的主要原因,因此将一个人基因组的所有编码区(即外显子区域)提取出来进行测序就可以很好的了解该个体的基因组突变信息,进而评估该个体的患病风险。因此,在当前对全基因组进行测序的成本还是很高的情况下,对所有的人类外显子进行测序是解码个人基因组和实现个体化医疗的重要手段。
因此,基于外显子区域或目标区域捕获(Target Region Capture)的高通量测序方法应运而生。该技术的基本原理是使用一套寡核苷酸探针来捕获基因组上的目标序列,然后使用通用引物对这些捕获到的序列进行PCR扩增,最后对这些扩增产物进行高通量测序,从而识别DNA样品中的碱基序列。
综上所述,提供一种检测基因组目标区域多态性位点的方法及系统,解决现有基因组外显子检测手段不完善、数据庞杂、准确度不高以及分析速度慢等缺陷,成为本领域亟待解决的技术问题。
发明内容
本发明要解决的一个技术问题是提供一种检测基因组目标区域多态性位点的方法及系统,通过对实验样品进行深度、覆盖度分析、捕获效率分析、性别检验、SNP位点杂合度一致性等检验,解决了基因组外显子区域生物信息学分析方法和工具不完善的问题,大大提高了对基因组外显子数据分析的准确性和可靠性。
本发明的一个方面提供了一种检测基因组目标区域多态性位点的方法,该方法包括:获取外显子测序结果步骤:对人类基因组DNA样品进行测序和纯化处理,得到外显子区域测序结果;将外显子区域测序结果与参考基因序列进行比对得到精确的比对结果;去冗余与排序步骤:对比对后获得的比对结果进行去除重复信息和排序处理;统计分析步骤I:对全局的目标区域进行深度和覆盖度统计,以及用X,Y染色体的目标区域的测序深度,对样本的性别进行检验;判断样品是否被污染;探测SNP位点步骤:从排序处理后的结果中找到SNP位点;SNP位点过滤步骤:以质量值为指标对探测得到的SNP位点进行筛选;统计分析步骤II:对过滤后的SNP位点的覆盖度进行统计,并以每个SNP位点的最优等位基因支持深度和次优等位基因支持深度进行分析,判断样品是否被污染;SNP注释步骤:用过滤后的SNP位点与dbSNP数据库中的信息进行比较,并结合ccds、refseq、ensembl数据库中至少一个中的数据对比对吻合的SNP位点进行注释与分类。
本发明提供的检测基因组目标区域多态性位点的方法的一个实施例中,在获取外显子测序结果步骤中,通过将测序结果中含有的、由测序过程引入的linker序列和adapter序列去除以实现纯化处理;以及利用Soap工具将外显子区域测序结果与参考基因序列进行比对,得到精确的比对结果。
本发明提供的检测基因组目标区域多态性位点的方法的一个实施例中,在去冗余与排序步骤中,将比对结果去除重复信息后按照染色体和坐标排序,排序处理后的结果作为探测SNP位点步骤待处理的对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技有限公司,未经深圳华大基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010270464.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液压缸同步控制装置及其控制方法
- 下一篇:密闭型压缩机转子的连接结构