[发明专利]一种肺腺癌生物标志物筛选、预后模型构建及生物学验证的新方法有效
| 申请号: | 202110475896.9 | 申请日: | 2021-04-29 |
| 公开(公告)号: | CN113130002B | 公开(公告)日: | 2022-11-08 |
| 发明(设计)人: | 刘元宁;赵曦;张浩;钟晓丹;王林宇 | 申请(专利权)人: | 吉林大学 |
| 主分类号: | G16B20/00 | 分类号: | G16B20/00;G06K9/62;G06N20/10 |
| 代理公司: | 长春市恒誉专利代理事务所(普通合伙) 22212 | 代理人: | 鞠传龙 |
| 地址: | 130012 吉*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 腺癌 生物 标志 筛选 预后 模型 构建 生物学 验证 新方法 | ||
本发明公开了一种肺腺癌生物标志物筛选、预后模型构建及生物学验证的新方法,其方法为:步骤一、对原始的基因表达矩阵进行数据的预处理;步骤二、在经过预处理后得到的数据上进行生物标志物筛选;步骤三、使用经过上述多步骤特征选择的肺腺癌预后标志物构建预后模型;步骤四、建模之后对选出的标志物进行生信分析。有益效果:使用线性支持向量机模型验证45个基因标志物,利用五折较差验证的AUC和ACC作为模型评估指标,最终的结果为AUC=0.98,ACC=0.92。该结果明显优于大多数传统基因标志物选择方法,本发明不仅能找出与肺癌相关的标志物,准确预测肺癌患者的生存期,同时还能发掘与肺腺癌发生相关的通路,探究肺腺癌的发生机制。
技术领域
本发明涉及一种模型构建及生物学验证的新方法,特别涉及一种肺腺癌生物标志物筛选、预后模型构建及生物学验证的新方法。
背景技术
目前,肺癌是一种死亡率和发病率居全世界首位的恶性肿瘤。除此之外,肺癌恶性程度高,预后较差,5年生存率仅有8%。肺癌的治疗手段多种多样,传统的治疗手段包括药物治疗、手术治疗、放疗、化疗等。进入二十一世纪后,分子靶向治疗取得了重大突破,通过针对癌症特异性因子进行治疗的效果远远好于传统疗法。因此,找到与癌症的发病机理相关的特异性生物分子也是当前的肿瘤生物学领域的研究热点。
近几年越来越多的研究团队致力于肺腺癌肿瘤标志物的挖掘和预后模型的构建,这些方法可以分为两类,一类是基于传统生物学的方法:研究者们采集肺癌患者的尿液,血浆,病理切片,细胞组织液等生物样本,通过分析实验组和对照组中不同生物分子的浓度,或者通过抗原-抗体结合反应、相关激酶代谢反应、免疫学反应或者与某种特定试剂的阳性反应来判断。这样生化方法通常手段复杂,实验花费开销昂贵,效率低,同时会由于实验人员的操作带来误差。另一类是基于高通量组学与统计学、机器学习结合的标志物挖掘方法。常规的方法包括以医学统计学为基础,最常见的是Cox变量分析寻找与预测目标相关性较强的标志物,并使用KM曲线进行生存分析挖掘标志物的方法。同时,生信数据库在标志物的筛选中也发挥重要作用,例如DAVID,STRING,GeneBank,Gene Ontology等被广泛地应用于生物信息的挖掘中。随着机器学习和数据挖掘技术的发展,越来越多的方法被应用到标志物的筛选中。常规的RFE特征选择算法,二进制的粒子群优化算法,深度学习也在不同的数据集体现出色性能,同时使用机器学习算法取代传统的风险回归模型也能的都更高的精度。虽然基于高通量的手段可以减小实验损耗,提升效率,但是面对上万维度的特征时,如何有效地选出最佳标志物这一问题,依然是当前相关领域要解决的重点难题。
递归特征消除的主要思想是反复的构建模型,然后根据特征重要性筛选删除一部分不重要的特征,接下来在剩余的特征上重复这个过程,直到当前特征集合为空为止。之后输出被删除的特征排序即为即为特征重要性排序。在生物学信息中,SVM与RFE结合是最常用的方法,在多个生物组学数据集中表现优越。
SFFS算法,即序列浮动向前算法是一种常见的基于Wrapper的特征选择方法,基本思想如下:从空集开始,在未选择的特征中选择一个特征x,使子集加入x后评价函数达到最优。然后在已选择的特征中删除一个特征y,使子集剔除z后评价函数达到最优。
发明内容
本发明的目的是能快速、准确地筛选与肺腺癌患者预后生存相关的标志物,利用选出的标志物构建预后模型并对这些标志物进行生物信息学验证,而提供的一种肺腺癌生物标志物筛选、预后模型构建及生物学验证的新方法。
本发明提供的肺腺癌生物标志物筛选、预后模型构建及生物学验证的新方法,其方法包括如下步骤:
步骤一、对原始的基因表达矩阵进行数据的预处理,首先使用匹配文件进行注释,将探针名改为基因名,按照如下方式进行数据预处理:
1)、删除缺失率超过20%的转录组特征基因;
2)、删除方差接近0的转录组特征基因;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110475896.9/2.html,转载请声明来源钻瓜专利网。





