[发明专利]单样本全基因组预测等位基因特异性拷贝数变异的方法有效
| 申请号: | 202110020493.5 | 申请日: | 2021-01-07 |
| 公开(公告)号: | CN112802548B | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 黄毅;陈海新;刘久成;吴玲清;刘青峰 | 申请(专利权)人: | 深圳吉因加医学检验实验室 |
| 主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/30;G16B30/10;G16B40/00 |
| 代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 周建军;郭燕 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 样本 基因组 预测 等位基因 特异性 拷贝 变异 方法 | ||
1.一种单样本全基因组预测等位基因特异性拷贝数变异的方法,其特征在于,包括:
分析比对到参考基因组的待测样本的测序数据,提取肿瘤纯度信息、全基因组复制信息和总拷贝数变异信息,然后根据染色体每个区段的总拷贝数变异信息进行分类处理,将总拷贝数变异信息转换成等位基因特异性拷贝数变异信息,如果染色体区段的总拷贝数变异信息为奇数区间或0区间,则直接推算出等位基因特异性拷贝数变异信息,如果染色体区段的总拷贝数变异信息为非0偶数区间,则通过模型预测得到该区间的等位基因特异性拷贝数变异信息;
如果染色体区段的总拷贝数变异信息为非0偶数区间,通过模型预测得到该区间的等位基因特异性拷贝数变异信息的方法包括:按照滑动窗口对总拷贝数变异信息进行切割,并独立预测各个滑动窗口的拷贝数变异类型,然后将所述拷贝数变异类型转换为等位基因特异性拷贝数变异信息,具体地,获取滑动区间内的候选信号位点的次等位基因频率信息分布,然后提取次等位基因频率信息分布曲线矩阵值,将所述次等位基因频率信息分布曲线矩阵值与肿瘤纯度信息、全基因组复制信息整合,将整合结果输入模型,使用模型预测得到该区间的基因拷贝数变异类型,然后将所述基因拷贝数变异类型转换为等位基因特异性拷贝数变异信息;
所述模型的构建方法包括:
信息提取步骤,包括分析比对到参考基因组的肿瘤样本和相应的正常样本的测序数据,提取等位基因特异性拷贝数变异信息、肿瘤纯度信息和全基因组复制信息,将这些信息作为答案集,根据等位基因特异性拷贝数变异信息,获得总拷贝数变异信息为非0偶数区间的测序数据的起点、终点以及拷贝数变异类型;
不同纯度肿瘤样本制备步骤,包括将正常样本的测序数据混入同一生物体来源的肿瘤样本的测序数据中,降低肿瘤纯度,获得由不同肿瘤纯度的样本测序数据组成的模拟样本数据集,将模拟样本数据集中候选信号位点的次等位基因频率分布信息、肿瘤纯度信息、全基因组复制信息作为机器学习输入特征值,以各个样本的等位基因特异性拷贝数变异信息作为标签,构建得到机器学习模型。
2.如权利要求1所述的方法,其特征在于,如果总拷贝数变异信息为奇数区间,则等位基因A =1,等位基因B =N-1;其中,N为该区间的总拷贝数变异信息;如果总拷贝数变异信息为0区间,则等位基因A=0,等位基因B=0。
3.如权利要求1所述的方法,其特征在于,滑动窗口的长度为2Mb-3Mb。
4.如权利要求1所述的方法,其特征在于,按以下规则将所述基因拷贝数变异类型转换为等位基因特异性拷贝数变异信息:
1)如果模型预测的基因拷贝数变异类型为AA,则等位基因A = 0,等位基因B = N,其中,N为该区间的总拷贝数变异信息;
2)如果模型预测的基因拷贝数变异类型为AB,则等位基因A = 等位基因B = N/2,其中,N为该区间的总拷贝数变异信息。
5.如权利要求1所述的方法,其特征在于,所述候选信号位点需满足以下条件中的至少一种:
1)该位点为杂合位点;
2)位点测序深度大于6;
3)该位点为非复等位基因位点;
4)该位点的变异质量值大于10;
5)该位点不在黑名单区间上;
6)该位点与相邻的候选信号位点距离大于30bp。
6.如权利要求5所述的方法,其特征在于,所述候选信号位点需满足条件1)至条件6)中的全部。
7.如权利要求5所述的方法,其特征在于,所述黑名单区间包括染色体上重复序列区域、端粒重复区域。
8.如权利要求1所述的方法,其特征在于,所述待测样本的测序数据的测序深度≥8×。
9.如权利要求1所述的方法,其特征在于,所述待测样本的测序数据的测序深度为8×至29×,包括边界值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳吉因加医学检验实验室,未经深圳吉因加医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110020493.5/1.html,转载请声明来源钻瓜专利网。





