[发明专利]基于reads深度进行目的基因外显子水平重排检测的方法及装置有效
| 申请号: | 202110707105.0 | 申请日: | 2021-06-24 |
| 公开(公告)号: | CN113284557B | 公开(公告)日: | 2021-10-15 |
| 发明(设计)人: | 楼峰;刘凯;马纪香;张萌萌;郭璟;孙宏;曹善柏 | 申请(专利权)人: | 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;天津橡鑫医疗器械有限公司 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B20/00;G16B45/00;G16B50/30 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 金田蕴 |
| 地址: | 102600 北京市大兴区经济技*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 reads 深度 进行 目的 基因 外显子 水平 重排 检测 方法 装置 | ||
1.一种基于reads深度进行目的基因外显子水平重排检测的方法,其特征在于,包括:
S1,将参考基因组划分为多个bin,根据目的基因分为target区域的bin和off-target区域的bin,将reads比对到所述参考基因组上,并分别计算target区域和off-target区域的每个bin内的平均reads深度和深度的log2值;
S2,合并target区域和off-target区域reads深度统计,并将其标准化;
S3,对所述S2中标准化的结果进行拷贝数变异查找,对于标准化后得到的log2根据阈值进行定义目的基因的缺失和重复状态;
所述S2中的标准化包括:利用搭建好的reference数据库进行标准化,校正测序基因组GC含量、重复序列和目标区域的密度从而校正bin 深度,所述reference数据库是用N个健康人比对软件的输出结果Bam文件构建的,包括健康人的reads深度统计及log2标准化值、基因组的GC、重复序列和目标区域的密度,所述N≥20;
所述S2中的标准化中,Off-target区域是根据参考基因组fa进行扩展获得的包括端粒在内的全部参考基因组序列和target区域进行筛选得到的Off-target区域;利用如下公式校正bin深度,减去reference数据库的深度的log2值,滑动居中log2比率;,其中,第i个bin标准化后的reads数量定义为Ai,Ci是第i个bin中的read的数量,M是具有正常拷贝数的bin的预期reads计数,αi为GC不同含量评估值,βi为mappability评估值。
2.根据权利要求1所述的方法,其特征在于,所述基于reads深度进行目的基因外显子水平重排检测的方法还包括:S4,筛选划分不同bin中的目的基因的区域,进行过滤其他bin,合并目的基因的检测结果,利用所述标准化后的reads深度分布进行可视化展示。
3.根据权利要求1所述的方法,其特征在于,所述bin为外显子水平的bin。
4.根据权利要求1所述的方法,其特征在于,所述S1具体包括:将所述参考基因组长度设置为n,平均划分为m个bin,则每一个bin长度为n/m;如果Ci是i个bin中的reads的数量,那么所有reads数据量是:,并由此计算target区域和off-target区域的每个bin内的平均reads深度和深度的log2值。
5.根据权利要求1所述的方法,其特征在于,所述目的基因为BRCA1/2,所述S3中对于标准化后得到的log2根据阈值进行定义目的基因的缺失状态包括:Log2值小于-0.4定义为cn=1,为杂合缺失;Log2值小于-1.1定义为cn=0,为纯合缺失,Log2值大于0.7定义为扩增。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;天津橡鑫医疗器械有限公司,未经北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;天津橡鑫医疗器械有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110707105.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能控制充气的气艇
- 下一篇:一种染整过程中使用的废水处理装置





