[发明专利]一种用于基因检测Panel临床诊断指标算法开发的方法在审
申请号: | 202111251878.9 | 申请日: | 2021-10-26 |
公开(公告)号: | CN114203261A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 汪强虎;李铜舒;吴玲祥;黄斌;夏鹏;葛东伟;吴维;李杰;王子宇 | 申请(专利权)人: | 昂凯生命科技(苏州)有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 曹坤 |
地址: | 215163 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 基因 检测 panel 临床 诊断 指标 算法 开发 方法 | ||
1.一种用于基因检测Panel临床诊断指标算法开发的方法,其特征在于,包括构建虚拟基因检测Panel及针对虚拟基因检测Panel的数据进行临床指标分析算法开发的两个传递过程;
一、所述构建虚拟基因检测Panel的具体传递过程如下:
(1)、提供设计的基因检测Panel中涉及的所有检测位点的信息,
(2)、对全基因组或全外显子组的测序数据进行过滤;
(3)、基于一系列与测序相关的参数,对保留涵盖在检测位点内的测序数据进行模拟,
(4)、对通过模拟的数据进行整理和保存,并将其作为虚拟基因检测Panel数据;
二、所述用于针对虚拟基因检测Panel数据进行临床指标分析算法的开发的具体传递过程如下:
(5)、针对进行过滤的全基因组或全外显子组的测序数据,采用既有的指标分析算法进行分析;
(6)、针对提供的虚拟基因检测Panel数据,采用既有的指标分析算法进行分析;
(7)、整合步骤(5)和(6)的分析结果:将步骤(5)中每个样本的结果对应到步骤(6)相应样本中,并标记为该样本的预期结果;
采用适当的机器学习算法基于整合的结果进行模型训练;
(8)、评估各种计算模型的性能,选择最优方案。
2.根据权利要求1所述的一种用于基因检测Panel临床诊断指标算法开发的方法,其特征在于,在步骤(1)中,所述提供的信息包括但不限于位点在基因组上的位置信息及位点的序列信息。
3.根据权利要求1所述的一种用于基因检测Panel临床诊断指标算法开发的方法,其特征在于,在步骤(2)中,所述对全基因组或全外显子组的测序数据进行过滤具体是指:基于步骤(1)中提供的检测位点信息对测序数据进行提取,仅保留涵盖在检测位点内的测序数据。
4.根据权利要求1所述的一种用于基因检测Panel临床诊断指标算法开发的方法,其特征在于,在步骤(3)中,所述基于一系列与测序相关的参数包括但不限于测序采用的平台、序列的长度、测序深度及序列上GC含量;
所述模拟过程包括但不限于按照参数设置重新对检测位点内的测序数据中的读段分布及富集度进行拟合,使得产生的数据和在真实情况下得到的基因检测Panel的测序数据在读段分布及富集度一致。
5.根据权利要求1所述的一种用于基因检测Panel临床诊断指标算法开发的方法,其特征在于,在步骤(6)中,所述通过指标分析算法进行分析的分析结果分为训练集和测试集两组;
所述训练集和测试集是通过对已有数据随机按照7:3的比例进行分组的,其中,70%的样本数据被当作训练集用于训练模型;剩下的30%的数据作为测试集,用来最后评估模型的预测性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昂凯生命科技(苏州)有限公司,未经昂凯生命科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111251878.9/1.html,转载请声明来源钻瓜专利网。