[发明专利]一种用于检测淋巴瘤基因变异的试剂盒及其应用有效
| 申请号: | 202010642606.0 | 申请日: | 2020-07-06 |
| 公开(公告)号: | CN111662983B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 杨玲;易鑫;管彦芳;易玉婷;杜新华;刘涛;徐亚平;李盼松 | 申请(专利权)人: | 北京吉因加科技有限公司;北京吉因加医学检验实验室有限公司 |
| 主分类号: | C12Q1/6886 | 分类号: | C12Q1/6886;C12Q1/6858;C12N15/11;G16B20/20;G16B20/50;G16B15/30 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 尹力 |
| 地址: | 北京市昌平区中关村科技园区昌平园生命园路*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 检测 淋巴瘤 基因 变异 试剂盒 及其 应用 | ||
1.一种弥漫大B细胞淋巴瘤COO分型系统,其特征在于,包括分型模型创建单元和预测单元;
分型模型创建单元:提取并处理训练集样本基因变异数据的特征,使用机器学习分类方法生成COO分型模型;
预测单元:提取并处理待分型样本的基因变异数据的特征,输入所述COO分型模型,调取分型的结果和/或概率;
所述基因变异数据是利用用于检测BCL2、BCL6、MYC和/或IGH基因融合的成套DNA探针检测到的;所述成套DNA探针包括SEQ ID NO:1-SEQ IDNO:376所示的376条探针;
所述机器学习分类方法为朴素贝叶斯算法、随机森林算法或梯度提升迭代决策树;
所述分型模型创建单元和预测单元之间还包括,验证单元:提取并处理验证集样本基因变异数据的特征,输入所述COO分型模型,进行验证;
分型模型创建单元分别使用朴素贝叶斯算法、随机森林算法或梯度提升迭代决策树3种算法生成分型模型后,预测单元输出的分型结果一致时,采用基于朴素贝叶斯算法的分型结果和/或概率;分型结果不一致时选择2种算法生成的分型模型一致的结果,属于某一亚型的概率为2种算法生成的分型模型输出概率的平均数;
分型模型创建单元使用朴素贝叶斯算法生成分型模型时命名为基于朴素贝叶斯算法的分型模型创建单元,相应的预测单元命名为基于朴素贝叶斯算法的预测单元;
所述基于朴素贝叶斯算法的分型模型创建单元包括,训练集基因变异数据的特征提取单元、训练集基因变异数据的特征处理单元和分型模型创建核心单元;
训练集基因变异数据的特征提取单元:提取训练集样本的基因变异数据的特征;
训练集基因变异数据的特征处理单元:将提取的特征转化为用于朴素贝叶斯算法训练输入的特征矩阵;
分型模型创建核心单元:根据基因变异数据的特征处理单元中的特征矩阵,以及训练集样本的先验概率,训练朴素贝叶斯COO分型模型;
基于朴素贝叶斯算法的预测单元,包括如下3个单元:待分型样本基因变异特征提取和处理单元、预测核心单元;
待测样本基因变异特征提取和处理单元:将待分型样本的基因变异数据的特征提取并转化为用于基于朴素贝叶斯算法的分型模型创建单元中的数据特征;
预测核心单元,将待分型样本的基因变异数据的特征提取和处理单元的数据特征输入所述朴素贝叶斯COO分型模型,计算待分型的样本GCB的分型概率P(GCB)和样本ABC的分型概率P(ABC);
如果P(GCB)大于P(ABC),所述待测样本为GCB型,如果P(ABC)大于P(GCB),所述待测样本为ABC型;
分型模型创建单元使用随机森林算法生成分型模型时,命名为基于随机森林算法的分型模型创建单元,相应的预测单元命名为基于随机森林算法的预测单元;
基于随机森林算法的分型模型创建单元,包括如下3个单元:训练集样本基因变异特征提取单元、训练集样本基因变异特征处理单元和分型模型创建核心单元;
训练集样本基因变异特征提取单元:提取训练集样本的基因变异特征;
训练集样本基因变异特征处理单元:将提取的特征转化为可用于随机森林算法训练输入的特征矩阵;
分型模型创建核心单元:根据基因变异特征处理单元筛选出来的特征矩阵,bootstrip抽取样本和特征并构建分类回归树;
基于随机森林算法的预测单元,包括:待分型样本基因变异特征提取和处理单元和预测核心单元;
基因变异特征提取和处理单元,将待分型样本的基因变异特征提取并转化为可用于随机森林算法训练输入的特征矩阵;
预测核心单元,将基因变异特征提取和处理单元的数据特征,输入基于随机森林算法的分型模型创建单元得到的分类回归树,随机森林COO分型模型得出弥漫大B淋巴瘤分型结果和概率;具体包括:
第1预测核心单元:按照随机森林COO分型模型中的各个CART决策树的特征分别输入各自的CART决策树分别预测COO的分型结果;
第2预测核心单元:根据第1预测核心单元的分型结果,选择分型结果较多的分型作为样本的预测分型,该分型的在所有CART决策树的占比作为该分型的概率;
分型模型创建单元使用梯度提升迭代决策树生成分型模型时,命名为基于梯度提升迭代决策树的分型模型创建单元,相应的预测单元命名为基于梯度提升迭代决策树的预测单元;
基于梯度提升迭代决策树的分型模型创建单元基于梯度提升迭代决策树的分型模型创建单元,包括如下3个单元:训练集基因变异特征提取单元、训练集基因变异处理单元和分型模型创建核心单元;
训练集基因变异特征提取单元:提取训练集样本的基因变异特征;
训练集基因变异处理单元:将提取的特征转化为用于梯度提升迭代决策树训练输入的特征矩阵;
分型模型创建核心单元:根据训练集基因变异处理单元筛选出来的特征矩阵,构建梯度提升迭代决策树COO分型模型;
基于梯度提升迭代决策树的预测单元,具体包括:待分型样本基因变异特征提取和处理单元、预测核心单元;
基因变异特征提取和处理单元:提取并处理待分型样本基因变异特征,转化为可用于梯度提升迭代决策树COO分型模型的输入特征;
预测核心单元:将基因变异特征提取和处理单元得出的数据特征,输入梯度提升迭代决策树COO分型模型得出分型结果和概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京吉因加科技有限公司;北京吉因加医学检验实验室有限公司,未经北京吉因加科技有限公司;北京吉因加医学检验实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010642606.0/1.html,转载请声明来源钻瓜专利网。





