[发明专利]一种拷贝数变异的检测方法、装置、存储介质及其应用有效
申请号: | 202111002171.4 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113674803B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 旷婷;刘成林;张光亮;张之宏;张周;揣少坤;汉雨生 | 申请(专利权)人: | 广州燃石医学检验所有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B50/00 |
代理公司: | 上海巅石知识产权代理事务所(普通合伙) 31309 | 代理人: | 蒋舫玮 |
地址: | 510300 广东省广州市黄埔区广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 拷贝 变异 检测 方法 装置 存储 介质 及其 应用 | ||
1.一种拷贝数状态分析方法,其特征在于,包含以下步骤:
步骤S1:获取待测样本在目标区间中每个碱基的测序数据和/或多个参考样本的测序数据;
步骤S2:基于所述目标区间的所述测序数据,通过聚类分析的方法将所述参考样本分为两个或以上参考样本组;
步骤S3:基于在所述目标区间上所述参考样本组与所述待测样本的所述测序数据,确认所述待测样本与所述参考样本组的相似度,从而确定与所述待测样本最接近的参考样本组;
步骤S4:使所述待测样本的目标基因在所述目标区间上的测序数据的均值除以所述与待测样本最接近的参考样本组在相应目标区间上的测序数据的均值,再乘以倍性,确定所述待测样本的目标基因在目标区间i上的拷贝数CNi;基于所述待测样本的所述目标区间i上的拷贝数CNi以及所述待测样本的所述目标基因的外显子的长度,确定所述待测样本在目标基因上的拷贝数CNg,从而确定所述待测样本的目标基因的拷贝数状态。
2.如权利要求1所述的方法,其特征在于,所述步骤S1包含步骤S1-1:通过基因测序获取所述待测样本和/或所述参考样本的所述测序数据。
3.如权利要求2所述的方法,其特征在于,所述基因测序包含二代基因测序。
4.如权利要求1所述的方法,其特征在于,所述样本选自以下组:组织样本、血液样本、唾液、胸腔积液、腹腔积液和脑脊液。
5.如权利要求1所述的方法,其特征在于,所述测序数据包含测序读长计数。
6.如权利要求1所述的方法,其特征在于,所述步骤S1包含步骤S1-2:矫正所述待测样本和/或参考样本的所述测序数据。
7.如权利要求6所述的方法,其特征在于,所述步骤S1-2包含:使所述待测样本和/或参考样本的所述测序数据标准化。
8.如权利要求7所述的方法,其特征在于,所述标准化包含使所述目标区间上所述测序数据除以所述目标区间对应的样本的所有目标区间上所述测序数据的总和,再乘以因子。
9.如权利要求6所述的方法,其特征在于,所述步骤S1-2包含:使所述待测样本和/或参考样本的所述测序数据平滑化。
10.如权利要求9所述的方法,其特征在于,所述平滑化包含基于测序偏差量,通过回归的方法使所述待测样本和/或参考样本的所述测序数据平滑化。
11.如权利要求10所述的方法,其特征在于,所述回归包含局部加权回归。
12.如权利要求10所述的方法,其特征在于,所述测序偏差量包含所述目标区间上覆盖的探针数。
13.如权利要求10所述的方法,其特征在于,所述测序偏差量包含所述目标区间的GC含量。
14.如权利要求13所述的方法,其特征在于,所述步骤S1-2包含:筛除GC含量异常的所述目标区间。
15.如权利要求14所述的方法,其特征在于,所述GC含量异常的所述目标区间包含GC含量为25%或更低的所述目标区间和/或GC含量为75%或更高的所述目标区间。
16.如权利要求1所述的方法,其特征在于,所述聚类分析的方法包含K均值聚类和/或层次聚类。
17.如权利要求1所述的方法,其特征在于,所述步骤S2包含步骤S2-2:确认所述参考样本组的所述测序数据的统计值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州燃石医学检验所有限公司,未经广州燃石医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111002171.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无线控制的LED灯感应电路
- 下一篇:一种公路施工用路基边缘防护装置