[发明专利]测序数据读段重新比对的方法在审
| 申请号: | 201780077066.2 | 申请日: | 2017-11-15 |
| 公开(公告)号: | CN110168647A | 公开(公告)日: | 2019-08-23 |
| 发明(设计)人: | G·贝里;庄瀚宇;J·戈登;陈晓;S·坦纳 | 申请(专利权)人: | 宜曼达股份有限公司 |
| 主分类号: | G16B20/00 | 分类号: | G16B20/00 |
| 代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 王允方 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 比对 比对处理 参考序列 测序数据 序列比对 扁平化 数据集 选择标准 近端 去除 引入 创建 | ||
本发明涉及测序数据读段重新比对。一种方法是从序列比对数据集获得读段序列与参考序列的初始比对,并对所述初始比对进行重新比对处理。重新比对处理包含鉴定候选插入缺失,所述候选插入缺失包含比对读段中的零或多个插入缺失以及在比对读段近端比对的零或多个插入缺失,如序列比对数据集指示;至少基于从比对读段中去除由初始比对指示的任何插入缺失来创建扁平化比对读段;并基于针对候选重新比对中的每个候选重新比对将候选插入缺失中的至少一个相应候选插入缺失引入扁平化比对读段来确定读段序列与参考序列的候选重新比对。所述方法进一步基于选择标准来提供初始比对或候选重新比对中的所选候选重新比对。
背景技术
下一代测序数据分析的持续挑战是插入和缺失(“插入缺失”)的准确调用。这种困难的原因包含较低的发生率、难以作图到基因组中的正确位置以及基因组中存在阻止唯一作图的重复区域。另一个原因是当前的比对工具无法正确地鉴定在读段的末端处的变异体或鉴定准确性不够。这是由于缺少调用变异体的双侧位置信息(two-sided context)而造成的。
发明内容
通过提供计算机实现方法、计算机系统和计算机程序产品,克服了现有技术的缺点并提供了另外的优点。
根据一个实施例,一种用于测序数据读段(read)重新比对的计算机实现方法包含:从序列比对数据集获得读段序列与参考序列的初始比对,所述初始比对包括比对读段;对所述初始比对进行重新比对处理,所述重新比对处理将所述读段序列与所述参考序列重新比对以产生一或多个候选重新比对,并且所述重新比对处理包括:鉴定一或多个候选插入缺失,所述一或多个候选插入缺失包括所述比对读段中的零或多个插入缺失以及在所述比对读段近端比对的零或多个插入缺失,如由所述序列比对数据集指示;至少基于从所述比对读段中去除由所述初始比对指示的任何插入缺失来创建扁平化比对读段;和基于针对所述一或多个候选重新比对中的每个候选重新比对将所述一或多个候选插入缺失中的相应至少一个候选插入缺失引入所述扁平化比对读段来确定所述读段序列与所述参考序列的一或多个候选重新比对;和基于一或多个选择标准来提供所述初始比对或所述一或多个候选重新比对中的所选候选重新比对。
所述一或多个候选插入缺失可以包括多个候选插入缺失,并且所述确定所述一或多个候选重新比对可以包括开始迭代地将所述多个候选插入缺失引入所述扁平化比对读段,其中通过将所述候选重新比对的所述相应至少一个候选插入缺失引入所述扁平化比对读段,所述迭代地引入的每次迭代提供了所述一或多个候选重新比对中的候选重新比对。
所述迭代地引入可以将所述多个候选插入缺失中的一或多个候选插入缺失的排列引入所述扁平化比对读段,以针对所述排列中的每个排列获得所述一或多个候选比对中的不同候选重新比对。
所述重新比对处理可以进一步包括:检查所述一或多个候选重新比对中的所提供候选重新比对,以确定所提供候选重新比对的比对读段(即具有所引入的一或多个相应候选插入缺失的所提供候选重新比对的所述比对读段)是否与所述参考序列比对并且所提供候选重新比对的所述比对读段和所述参考序列之间不存在错配碱基;基于确定所提供候选重新比对的所述比对读段与所述参考序列比对并且不存在错配碱基来停止所述迭代地引入;和选择所提供候选重新比对作为所选候选重新比对,其中所述提供基于所提供候选重新比对的所述比对读段与所述参考序列比对来输出所选候选重新比对。
所述重新比对处理可以进一步包括针对所述迭代地引入对所述多个插入缺失进行优先级排序,其中所述迭代地引入基于所述优先级排序按优先级顺序引入所述多个插入缺失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宜曼达股份有限公司,未经宜曼达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780077066.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:预测抗癌途径的验证
- 下一篇:序列变异识别的验证方法和系统





