[发明专利]测序数据读段重新比对的方法在审
| 申请号: | 201780077066.2 | 申请日: | 2017-11-15 |
| 公开(公告)号: | CN110168647A | 公开(公告)日: | 2019-08-23 |
| 发明(设计)人: | G·贝里;庄瀚宇;J·戈登;陈晓;S·坦纳 | 申请(专利权)人: | 宜曼达股份有限公司 |
| 主分类号: | G16B20/00 | 分类号: | G16B20/00 |
| 代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 王允方 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 比对 比对处理 参考序列 测序数据 序列比对 扁平化 数据集 选择标准 近端 去除 引入 创建 | ||
1.一种用于测序数据读段重新比对的计算机实施方法,所述方法包括:
从序列比对数据集获得读段序列与参考序列的初始比对,所述初始比对包括比对读段;
对所述初始比对进行重新比对处理,所述重新比对处理将所述读段序列与所述参考序列重新比对以产生一或多个候选重新比对,并且所述重新比对处理包括:
鉴定一或多个候选插入缺失,所述一或多个候选插入缺失包括所述比对读段中的零或多个插入缺失以及在所述比对读段近端比对的零或多个插入缺失,如所述序列比对数据集指示;
至少基于从所述比对读段中去除由所述初始比对指示的任何插入缺失来创建扁平化比对读段;和
基于针对所述一或多个候选重新比对中的每个候选重新比对将所述一或多个候选插入缺失中的至少一个相应候选插入缺失引入所述扁平化比对读段来确定所述读段序列与所述参考序列的所述一或多个候选重新比对;和
基于一或多个选择标准来提供所述初始比对或所述一或多个候选重新比对中的所选候选重新比对。
2.根据权利要求1所述的方法,其中所述一或多个候选插入缺失包括多个候选插入缺失,并且其中所述确定所述一或多个候选重新比对包括开始迭代地将所述多个候选插入缺失引入所述扁平化比对读段,其中所述迭代引入的每次迭代是通过将所述候选重新比对的所述至少一个相应候选插入缺失引入所述扁平化比对读段来提供所述一或多个候选重新比对中的候选重新比对。
3.根据权利要求2所述的方法,其中所述迭代引入是将所述多个候选插入缺失中的一或多个候选插入缺失的排列引入所述扁平化比对读段,以针对所述排列中的每个排列获得所述一或多个候选比对中的不同候选重新比对。
4.根据权利要求3所述的方法,其中所述重新比对处理进一步包括:
检查所述一或多个候选重新比对中的所提供候选重新比对,以确定所提供候选重新比对中的比对读段,即具有所引入的一或多个相应候选插入缺失的所提供候选重新比对中的所述比对读段,是否与所述参考序列比对并且所提供候选重新比对中的所述比对读段和所述参考序列之间不存在错配碱基;
基于确定所提供候选重新比对中的所述比对读段与所述参考序列比对并且不存在错配碱基来停止所述迭代引入;和
选择所提供候选重新比对作为所选候选重新比对,其中所述提供是基于所提供候选重新比对中的所述比对读段与所述参考序列比对来输出所选候选重新比对。
5.根据权利要求2所述的方法,其中所述重新比对处理进一步包括针对所述迭代引入对所述多个插入缺失进行优先级排序,其中所述迭代引入是基于所述优先级排序按优先级顺序引入所述多个插入缺失。
6.根据权利要求5所述的方法,其中所述优先级排序使参考插入缺失数据集指示为预知插入缺失的插入缺失优先于所述参考插入缺失数据集未指示为预知插入缺失的插入缺失。
7.根据权利要求5所述的方法,其中所述优先级排序使较长长度的插入缺失优先于较短长度的插入缺失。
8.根据权利要求5所述的方法,其中所述优先级排序使所述序列比对数据集的较大数量的比对读段中所指示的插入缺失优先于所述序列比对数据集的较小数量的比对读段中所指示的插入缺失,或者所述优先级排序使所述序列比对数据集中的与所述插入缺失相对于所述参考序列的位置对应的较大比例的比对读段中所指示的插入缺失优先于所述序列比对数据集中的较小比例的比对读段中所指示的插入缺失。
9.根据权利要求5所述的方法,其中在所述序列比对数据集中的相同数量的比对读段中所指示的不同插入缺失之间,所述优先级排序使相对于所述序列比对数据集中所指示的参考基因组序列的位置在相对于所述参考基因组序列的针对另一插入缺失指示的位置上游的插入缺失优先。
10.根据权利要求1所述的方法,其中所述选择标准至少部分地基于以下中的一或多个:错配碱基的数量、插入缺失的数量、插入缺失相对于所述序列比对数据集所指示的参考基因组序列的位置,和软切碱基的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宜曼达股份有限公司,未经宜曼达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780077066.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:预测抗癌途径的验证
- 下一篇:序列变异识别的验证方法和系统





