[发明专利]基因高通量测序数据突变检测方法有效
申请号: | 201711214506.2 | 申请日: | 2017-11-28 |
公开(公告)号: | CN107944225B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 李超 | 申请(专利权)人: | 慧算医疗科技(上海)有限公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 李庆 |
地址: | 201209 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 通量 序数 突变 检测 方法 | ||
1.一种基因高通量测序数据突变检测方法,包括步骤:
S1:获取一基因样本的高通量测序数据;
S2:生成所述基因样本的高通量测序数据的各基因序列的位置信息标签;
S3:根据所述位置信息标签将各所述基因序列分组并计算获得一突变总量;
S4:将所述突变总量代入一背景模型输出突变检测结果;
所述S2步骤进一步包括步骤:
S21:通过一序列对比算法将所述各基因序列对比到一参考基因组,形成各所述基因序列的比对信息;
S22:将所述比对信息存储于一SAM/BAM格式文件中;
S23:根据所述SAM/BAM格式文件判断各所述基因序列的序列来源的模板链Ti,1≤i≤n,n为所述基因序列个数;
S24:根据所述序列来源的模板链Ti和所述SAM/BAM格式文件生成各所述基因序列的位置信息标签;
所述S23步骤进一步包括步骤:
自所述SAM/BAM格式文件中提取每一条所述基因序列的一第一比对起始位置Pi、一同片段对比序列的一第二对比起始位置Qi、正负链信息Si和所述基因序列的序列号Ri;
当所述基因序列的序列号Ri等于所述SAM/BAM格式文件的read1位置的数值且所述正负链信息Si等于所述SAM/BAM格式文件的foward位置的数值时,或所述基因序列的序列号Ri不等于所述SAM/BAM格式文件的read1位置的数值且所述正负链信息Si不等于所述SAM/BAM格式文件的foward位置的数值时,所述序列来源的模板链Ti为正;
当所述基因序列的序列号Ri等于所述SAM/BAM格式文件的read1位置的数值且所述正负链信息Si不等于所述SAM/BAM格式文件的foward位置的数值时,或所述基因序列的序列号Ri不等于所述SAM/BAM格式文件的read1位置的数值且所述正负链信息Si等于所述SAM/BAM格式文件的foward位置的数值时,所述序列来源的模板链Ti为负;
所述位置信息标签表示为(Pi,Qi,Ti);
所述S3步骤进一步包括步骤:
S31:将所述位置信息标签一致的所述基因序列分至同一基因组;
S32:统计所述基因组中各所述基因序列与所述参考基因组一目标基因位置gi对应的一当前基因位置为突变型基因型且碱基质量q30的所述基因序列的突变数vj,j为大于等于1的自然数;
如vj0,记录所述当前基因位置碱基质量q30的所述基因序列个数nj;
如vj<f*nj,则vj=0,其中f为预设的最低碱基一致性比例值;
S33:重复步骤S32获得各所述目标基因位置的突变数vj,并根据所述突变数计算一突变总数其中
当时,保留的数值并继续后续步骤;
当时,将的数值清零并继续后续步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧算医疗科技(上海)有限公司,未经慧算医疗科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711214506.2/1.html,转载请声明来源钻瓜专利网。