[发明专利]一种基于长读长测序的多基因融合检测方法有效
| 申请号: | 201810915530.7 | 申请日: | 2018-08-13 |
| 公开(公告)号: | CN109033752B | 公开(公告)日: | 2021-09-17 |
| 发明(设计)人: | 何广良;郑灏 | 申请(专利权)人: | 杭州锘崴信息科技有限公司 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00;G16B50/30 |
| 代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 朱成之 |
| 地址: | 310059 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 长读长测序 多基因 融合 检测 方法 | ||
本发明公开了一种基于长读长测序的多基因融合检测方法,其包含以下步骤:步骤1:预处理和比对;步骤2:建立候选读长数据库;步骤3:对候选读长进行聚类,建立候选多基因融合比对坐标序列数据库;步骤4:确定断点位置,构建多基因融合突变数据库;步骤5:过滤多基因融合突变数据库,降低假阳性。本发明所提供的基于长读长测序的多基因融合检测方法,可有效检测多基因融合,灵敏度和阳性预测值等性能指标远远优于现有检测工具,为临床检测疾病提供判断依据。
技术领域
本发明涉及基因检测技术领域,具体涉及一种基于长读长测序的多基因融合检测方法。
背景技术
基因融合在基因组中非常普遍,也是一些类型癌症的标志。它由染色体重排而产生的,包括染色体的易位,插入,扩增,颠倒,缺失(非平衡重排)。基因融合常表现为两个不相关的基因融合形成,具有全新的功能或与两个融合前基因不同的功能。一个强启动子与一个下游功能基因(原癌基因)的融合在某些癌症中是普遍的。在生物体内发生融合基因,可导致疾病的发生。融合基因在癌症中普遍存在,与癌症的发生发展密切相关。
随着近几年基于短读长测序的高通量测序技术的飞速发展和普及,高通量测序已被广泛用于基因融合检测:基于短读长测序获得数据,使用各种不断改进的算法检测基因融合。但这还是存在很大问题:1.基因组重复序列导致的多重比对使得检测结果不确定;2.无法检测大片段的多基因融合。
发明内容
本发明的目的是提供一种基于长读长测序的多基因融合检测方法,以解决上述现有技术的问题。
为达到上述目的,本发明提供了一种基于长读长测序的多基因融合检测方法,其包含以下步骤:
步骤1:将通过DNA长读长测序得到的读长比对到参考基因组上,得到读长的基因组坐标,并仅保留每条读长的最优比对结果;
步骤2:将比对结果进行过滤,只保留可能存在基因融合突变的读长,得到候选读长数据库;
步骤3:对每一条候选读长,按照其不同区域片段的比对结果,使用区域片段比对坐标序列表示读长;对全部的区域片段比对坐标序列进行聚类合并,形成包含多个融合基因读长组的候选多基因融合比对坐标序列数据库,其中每一个融合基因读长组包含多个来源于同一个基因融合突变的读长;
步骤4:通过所述候选多基因融合比对坐标序列数据库中的每一个融合基因读长组确定对应的一个基因融合突变;为每一个基因融合突变确定其全部的断点坐标,形成多基因融合突变数据库。
上述的基于长读长测序的多基因融合检测方法,其中,步骤1中,所述比对通过Last比对算法处理。
上述的基于长读长测序的多基因融合检测方法,其中,步骤1中,在进行比对前还包括步骤预处理,所述预处理为先将经过DNA长读长测序得到的原始读长数据转换成fastq文件后,再通过过滤去除低质量的读长。
上述的基于长读长测序的多基因融合检测方法,其中,步骤2中,所述的可能存在基因融合突变的读长是指存在2个以上的区域片段比对坐标的读长。
上述的基于长读长测序的多基因融合检测方法,其中,步骤3 中,对全部的区域片段比对坐标序列进行聚类合并的具体过程为:对于任意的两条区域片段比对坐标序列a和b,且a的区域片段比对坐标数量大于b,如果对于b中的每一个区域片段比对坐标b(i),均在a中存在域片段比对坐标a(j+i) 或者a(j-i)与b(i)的左翼坐标的差值及右翼坐标的差值均小于10,则将b和a 聚类合并到一组;其中,b(i)表示b中第i个区域片段比对坐标,且1≤i≤b 的区域片段比对坐标总数;a(j+i)表示a中第j+i个区域片段比对坐标,且1 ≤j+i≤a的区域片段比对坐标总数;a(j-i)表示a中第j-i个区域片段比对坐标,且1≤j-i≤a的区域片段比对坐标总数。
上述的基于长读长测序的多基因融合检测方法,其中,步骤3 中,每个融合基因读长组需要2个以上的区域片段比对坐标序列支持。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州锘崴信息科技有限公司,未经杭州锘崴信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810915530.7/2.html,转载请声明来源钻瓜专利网。





