[发明专利]一种染色体异常检测装置有效
申请号: | 201810047686.8 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108268752B | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 糜庆丰;彭春方;张娟;赵宇;陈样宜;饶兴蔷;罗东红;黄铨飞;刘丽菲 | 申请(专利权)人: | 东莞博奥木华基因科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 523808 广东省东莞市松山湖高新技*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种染色体异常检测装置。现有的染色体异常检测分析均基于读长计数统计模型,仅能够去除比对到基因组中相同起始位置的重复序列,无法去除对于起始位置不同但是相互之间有重叠的reads;本发明装置通过引入序列覆盖度(coverage)统计模型,能有效去除单细胞全基因组扩增偏好性带来的重复序列及其重叠区域,显著提高数据的均一性,进而降低数据噪音,提高阳性样本的检出率以及降低假阳性率。 | ||
搜索关键词: | 染色体 去除 异常检测装置 重复序列 计数统计 假阳性率 全基因组 数据噪音 统计模型 序列覆盖 阳性样本 异常检测 重叠区域 基因组 检出率 均一性 偏好性 比对 扩增 引入 分析 | ||
【主权项】:
1.一种能去除重复序列的染色体异常检测装置,包括:测序数据获取单元:用于获取经高通量测序得到的读长片段;比对单元:用于将读长片段与人类基因组参考序列进行比对,获取读长片段的位置信息和长度信息;覆盖度计算单元:用于将人类基因组参考序列划分成若干个第一窗口,根据读长片段的位置信息和长度信息,计算各第一窗口的覆盖度,根据第一窗口的覆盖度和GC含量进行Loess校正;将若干个连续的第一窗口合并为第二窗口,计算第二窗口Loess校正后的覆盖度及其覆盖度占比;其中,覆盖度=区段内所覆盖的碱基总数/区段长度;覆盖度占比=区段的覆盖度/所有常染色体的覆盖度;候选CNV识别单元:用于利用环状二元分割算法识别染色体的断点位置,计算相邻断点间的CBS ratio,根据CBS ratio阈值识别候选CNV区域;假阳性过滤单元:用于计算候选CNV区域CBS ratio值的显著性水平P‑value,根据P‑value 过滤假阳性区域,获得待测样本的CNV区域和核型结果;其中,CBS ratio为环状二元分割算法识别的相邻断点间所有第二窗口覆盖度占比的均值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞博奥木华基因科技有限公司,未经东莞博奥木华基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810047686.8/,转载请声明来源钻瓜专利网。