[发明专利]一种检测染色体异常的方法及系统有效
申请号: | 201911369196.0 | 申请日: | 2019-12-26 |
公开(公告)号: | CN110993029B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 吴梦思;张静波;王伟伟;高司航;徐冰;伍启熹;王建伟;刘倩;唐宇 | 申请(专利权)人: | 北京优迅医学检验实验室有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 陈征 |
地址: | 100195 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 染色体 异常 方法 系统 | ||
1.一种检测染色体异常的方法,其特征在于,包括:
基因组测序,数据质控,数据预处理和染色体异常分析;
所述数据预处理包括:
将参考基因组划分为50~150kb大小的窗,相邻的窗包括45~100kb的重叠序列,将待测染色体的基因组测序结果和所述参考基因组进行比对,去除比对到同一位置且碱基序列一致的reads,得到每个窗内的unique reads数量;
所述染色体异常分析包括:
对所述待测染色体每个窗内的unique reads数量进行加权线性回归,权重为标准样本中对应位置的窗的标准差,将得到的每个窗的unique reads数量的拟合值和所述标准样本中对应位置的窗的标准值进行对比获得残差,利用所述残差判断所述待测染色体的异常;
所述利用所述残差判断所述待测染色体的异常包括:通过所述待测染色体起始连续的两个窗的残差计算得到残差的均值Mresidual和标准差Sresidual,对下一个连续的窗进行判断:
i)若所述下一个连续的窗的残差未偏离之前计算的残差的均值Mresidual 2~4个标准差Sresidual的范围,则认为趋势一致,对趋势一致的残差进行计算得到新的均值Mresidual和标准差Sresidual,重复判断过程;
ii)若非i),则认为趋势不一致,以新的连续的两个窗为新的种子,重复判断过程;
趋势一致的窗的残差的均值即可作为评估所述待测染色体是否存在嵌合体以及相应的嵌合比例。
2.根据权利要求1所述的方法,其特征在于,在所述数据预处理中,窗的大小为150kb,相邻的窗的重叠序列为100kb。
3.根据权利要求1所述的方法,其特征在于,所述数据预处理还包括去除reads为0或异常高的窗,对所有的窗进行性别校正和GC校正。
4.根据权利要求3所述的方法,其特征在于,所述性别校正包括:
若所述待测染色体来源为女性,则忽略来源的Y染色体,对来源的22条常染色体和X染色体上所有的窗进行标准化处理得到所述待测染色体每个窗中的unique reads数量;
若所述待测染色体来源为男性,则先将来源的X染色体和Y染色体每个窗的uniquereads数量分别乘以2,然后对24条染色体进行标准化处理得到所述待测染色体每个窗中的unique reads数量。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述标准样本的制备方法如下:
以多个染色体正常的健康样本为标准,进行所述基因组测序,所述数据质控和所述数据预处理过程,对预处理后的数据进行性别校正和GC校正,计算得到每个窗中的uniquereads数量,将所有健康样本同位置的窗中的unique reads数进行计算得到每个窗中的unique reads数量对应的均值和标准差。
6.根据权利要求5所述的方法,其特征在于,判断所述待测染色体来源为男性还是女性的步骤包括:
统计所述多个染色体正常的健康样本中男性和女性染色体上所有在窗中的uniquereads数量,以比对到chrY和chrX窗中的unique reads数量和测序后得到的所有reads数量的比值为依据,通过kmeans聚类得到划分性别的阈值。
7.根据权利要求1-4任一项所述的方法,其特征在于,所述数据质控具体为去除染色体测序结果中低质量reads,所述低质量reads为N碱基的碱基比例大于5%的reads,以及碱基质量小于Q5的碱基比例大于50%的reads。
8.根据权利要求5所述的方法,其特征在于,所述GC校正为对染色体内所有窗的GC含量进行排序,采用平滑样条法对每个窗进行GC校正,得到校正后的对应窗的unique reads数量。
9.一种检测染色体异常的系统,其特征在于,包括:
基因组测序模块,数据质控模块,数据预处理模块和染色体异常分析模块;
所述数据预处理模块用于将参考基因组划分为50~150kb大小的窗,相邻的窗包括45~100kb的重叠序列,将待测染色体的基因组测序结果和所述参考基因组进行比对,去除比对到同一位置且碱基序列一致的reads,得到每个窗内的unique reads数量;
所述染色体异常分析模块用于对所述待测染色体每个窗内的unique reads数量进行加权线性回归,权重为标准样本中对应位置的窗的标准差,将得到的每个窗的uniquereads数量的拟合值和所述标准样本中对应位置的窗的标准值进行对比获得残差,利用所述残差判断所述待测染色体的异常;
所述利用所述残差判断所述待测染色体的异常包括:通过所述待测染色体起始连续的两个窗的残差计算得到残差的均值Mresidual和标准差Sresidual,对下一个连续的窗进行判断:
i)若所述下一个连续的窗的残差未偏离之前窗的残差的均值Mresidual 2~4个标准差Sresidual的范围,则认为趋势一致,对趋势一致的残差进行计算得到新的均值Mresidual和标准差Sresidual,重复判断过程;
ii)若非i),则认为趋势不一致,以新的连续的两个窗为新的种子,重复判断过程;
趋势一致的窗的残差的均值即可作为评估所述待测染色体是否存在嵌合体以及相应的嵌合比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京优迅医学检验实验室有限公司,未经北京优迅医学检验实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911369196.0/1.html,转载请声明来源钻瓜专利网。