[发明专利]定点检测变异的方法和装置有效
申请号: | 201510981920.0 | 申请日: | 2015-12-22 |
公开(公告)号: | CN106909806B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 刘继龙;费凌娜;刘足;张纪斌;邵迪 | 申请(专利权)人: | 广州华大基因医学检验所有限公司;深圳华大生命科学研究院 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B25/10 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李志东 |
地址: | 510006 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种定点检出变异的方法,包括:基于变异的已知信息,确定变异的指定位点和包含该变异的参考序列;获取待测样本的核酸的测序数据,测序数据包括多个读段;提取测序数据中包含指定位点的读段,获得指定读段;以指定读段上的指定位点为中心,往两端方向各延伸N个bp,获得指定片段,4≤N≤10;将指定片段与包含变异的参考序列进行比对,获得支持读段,支持读段为与包含变异的参考序列匹配的指定片段所在的读段;统计支持读段的量,基于支持读段的量判断所述变异是否存在。该方法基于关注读段中是否存在发生变异后应当具有的序列特征来进行变异定点检测,能够规避变异位点附近比对质量下降的问题,能够快速精确的检出变异。 | ||
搜索关键词: | 定点 检测 变异 方法 装置 | ||
【主权项】:
1.一种定点检出变异的方法,其特征在于,包括:基于所述变异的已知信息,确定所述变异的指定位点和包含所述变异的参考序列;获取待测样本的核酸的测序数据,所述测序数据包括多个读段;提取所述测序数据中包含所述指定位点的读段,获得指定读段;以所述指定读段上的指定位点为中心,往两端方向各延伸N个bp,获得指定片段,4≤N≤10;将所述指定片段与所述包含所述变异的参考序列进行比对,获得支持读段,所述支持读段为与所述参考序列匹配的指定片段所在的读段;统计所述支持读段的量,基于所述支持读段的量判断所述变异是否存在;所述基于支持读段的量判断所述变异是否存在,包括:将所述支持读段的量代入到以下模型,获得参考值LOD(m,f),
所述模型基于以下两点假设而建立:(1)对于任一位点,假设参考基因组对应的碱基为r∈{A,T,C,G},(2)对于任一位点,假设覆盖该位点的所有读段的对应碱基为bi,碱基质量值为qi,则对应的碱基错误率为
d表示该位点对应的测序深度,其中M0表示所述位点的变异不存在,该位点与参考基因组碱基不同是由于系统误差导致的,
表示所述位点的变异真实存在,所述变异为r突变为m,f为等位基因突变频率,既不为r、也不为m的碱基是系统误差造成的,L(M0)表示所述位点的测序数据的分布情况符合M0的概率,
将所述支持读段的量代入式I以确定L(M0),
表示该所述位点的测序数据的分布情况符合
的概率,
将所述支持读段的量代入式III以确定
将所述参考值与阈值比较,当所述参考值大于所述阈值,判定所述待测样本存在所述变异。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华大基因医学检验所有限公司;深圳华大生命科学研究院,未经广州华大基因医学检验所有限公司;深圳华大生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510981920.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种多普勒计程仪测速误差的修正方法
- 下一篇:盖板(三爱心)