[发明专利]拷贝数变异预测方法、装置、计算机设备和存储介质有效
申请号: | 202010185580.1 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111402951B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 姚鸣;张鹏;王凯 | 申请(专利权)人: | 至本医疗科技(上海)有限公司 |
主分类号: | G16B20/10 | 分类号: | G16B20/10;G16B20/20 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 姜晓云 |
地址: | 200135 上海市浦东新区(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拷贝 变异 预测 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种拷贝数变异预测方法、装置、计算机设备和存储介质。所述方法包括:接收输入的待测样本及对照样本对应的基因序列文件;对基因序列文件进行分析得到单核苷酸多态性位点;根据预设输入参数计算逻辑,计算所得到的单核苷酸多态性位点对应的模型输入参数;将模型输入参数输入至位点拷贝数变异识别模型中,得到每个单核苷酸多态性位点对应的拷贝数状态及分割点位置;将每个单核苷酸多态性位点对应的拷贝数状态及分割点位置输入至染色体拷贝数变异识别模型中,得到待测样本对应的拷贝数变异状态及对应每一拷贝数变异状态的百分比,染色体拷贝数变异识别模型是根据长短期记忆网络训练模型得到的。采用本方法能够提高预测准确性。
技术领域
本申请涉及生物技术领域,特别是涉及一种拷贝数变异预测方法、装置、计算机设备和存储介质。
背景技术
随着生物技术的发展,出现了检测一个样本中是否存在染色体拷贝数异常的技术,拷贝数变异(Copy Number Variation,CNV)是由基因组发生重排而导致的,一般指长度为1kb以上的基因组大片段的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重复。CNV是基因组结构变异(Structural Variation,SV)的重要组成部分。CNV位点的突变率远高于SNP(Single Nucleotide Polymorphism),是肿瘤类疾病的重要致病因素之一。
然而,传统的技术方案是利用一个待检测的样本的基因组测序数据,通过数据分析的方法,判断样本中是否存在染色体拷贝数异常的问题,例如通过马尔代夫序列进行预测,但是马尔代夫序列因为是连续性有限、模式单一,这样就会造成检测不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高预测准确性的拷贝数变异预测方法、装置、计算机设备和存储介质。
一种拷贝数变异预测方法,所述方法包括:
接收输入的待测样本以及对照样本对应的基因序列文件;
对所述基因序列文件进行分析得到单核苷酸多态性位点;
根据预设输入参数计算逻辑,计算所得到的单核苷酸多态性位点对应的模型输入参数;
将所述模型输入参数输入至预先训练完成的位点拷贝数变异识别模型中,得到每个所述单核苷酸多态性位点对应的拷贝数状态以及分割点位置;
将每个所述单核苷酸多态性位点对应的拷贝数状态以及分割点位置输入至预先训练完成的染色体拷贝数变异识别模型中,得到所述待测样本对应的拷贝数变异状态以及对应每一所述拷贝数变异状态的百分比,所述染色体拷贝数变异识别模型是根据长短期记忆网络训练模型得到的。
在其中一个实施例中,所述将每个所述单核苷酸多态性位点对应的拷贝数状态以及分割点位置输入至预先训练完成的染色体拷贝数变异识别模型中,得到所述待测样本对应的拷贝数变异状态以及对应每一所述拷贝数变异状态的百分比之后,还包括:
将所述待测样本对应的拷贝数变异状态以及对应每一所述拷贝数变异状态的百分比输入至肿瘤预测模型中,得到所述待测样本对应的肿瘤含量以及倍型,所述肿瘤预测模型是根据长短期记忆网络训练模型得到的。
在其中一个实施例中,所述对所述基因序列文件进行分析得到单核苷酸多态性位点,包括:
从所述待测样本和对照样本对应的基因序列文件中的提取基因序列,并将所提取的基因序列分别与标准基因组进行比对,得到单核苷酸多态性位点。
在其中一个实施例中,所述根据预设输入参数计算逻辑,计算所得到的单核苷酸多态性位点对应的模型输入参数,包括:
统计所述待测样本的基因序列与所述标准基因组相同的第一序列以及不同的第二序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于至本医疗科技(上海)有限公司,未经至本医疗科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010185580.1/2.html,转载请声明来源钻瓜专利网。