[发明专利]互斥性约束图拉普拉斯的异质性癌症驱动基因识别方法有效
申请号: | 202010583114.9 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111785325B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 习佳宁;黄庆华 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16H50/20 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 常威威 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互斥性 约束 图拉 普拉 异质性 癌症 驱动 基因 识别 方法 | ||
本发明提供了一种互斥性约束图拉普拉斯的异质性癌症驱动基因识别方法。首先,获取癌症基因组变异数据与基因互作关系网络;然后,采用矩阵化模型对癌症的异质性进行描述,并通过互斥性约束矩阵分解对异质性癌症的样本参数进行差异化估计;接着,构建联合关联互作网络正则化的互斥性约束矩阵分解优化函数,并通过迭代求解对局部样本中的受互作影响驱动基因参数进行修正;最后,采用离群值检验方法识别驱动基因。本发明能够解决癌症样本的参数差异化估计与受互作影响局部样本驱动基因的有效识别问题,实现从异质性癌症样本的基因变异数据中识别出在局部样本发生变异的驱动基因。
技术领域
本发明属生物信息学、基因组数据挖掘技术领域,具体涉及一种互斥性约束图拉普拉斯的异质性癌症驱动基因识别方法。
背景技术
癌症是一种高发恶性疾病,主要由驱动基因的变异所导致。但在癌症基因组中,存在大量与癌变无关的伴随性变异,对判别驱动基因造成严重混淆。由于驱动基因变异比伴随性变异更倾向于在多例样本中同时发生,现有研究主要通过癌症样本的基因变异数据,将驱动基因视为多例样本中的高频变异基因,并通过考察基因变异率的统计显著性,寻找多样本中显著高频变异的驱动基因。如Lawrence等人在文献Lawrence S,Stojanov P,Polak P,et al.Mutational heterogeneity in cancer and the search for newcancer-associated genes[J].Nature,2013,499(7457):214中提出了一种基于各基因背景变异率修正的变异频率统计检验方法,以识别癌症样本中显著高频变异的基因。Kumar等人则在文献Kumar D,Swamidass J,Bose R.Unsupervised detection of cancerdriver mutations with parsimony-guided learning[J].Nature genetics,2016,48(10):1288中对驱动基因预测进一步采用精简化约束,以减少识别中的假阳性结果。然而,由于癌症还具有肿瘤异质性,即不同样本的变异驱动基因存在较大差异,加剧了驱动基因在局部样本分布的复杂性。对于具有肿瘤异质性的癌症,由于不同样本中的变异驱动基因差别较大,导致仅在局部样本中的变异驱动基因相对于全体样本呈现的变异率较低。尽管现有研究在异质性癌症各样本的亚类已知时,可对各类样本内的高变异率基因分别进行识别,但在样本类型缺失时则无法区分具有差异性的各局部样本,因而无法识别异质性癌症的局部样本驱动基因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010583114.9/2.html,转载请声明来源钻瓜专利网。