[发明专利]一种筛选特征mRNA用于诊断早期肺癌的方法在审
申请号: | 201911146308.6 | 申请日: | 2019-11-14 |
公开(公告)号: | CN110751983A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 李艳坤;马昕鹏;董汝南;庞佳烽;景璟 | 申请(专利权)人: | 华北电力大学(保定) |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16H50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 071003 河北省保定市*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 诊断 肺癌 样本 线性判别分析 准确度 肺癌诊断 训练集 预测集 筛选 相乘 标准化处理 生物标记物 模型筛选 正常样本 转换矩阵 矢量 建模 标准化 保留 更新 | ||
本发明公开了一种通过非相关线性判别分析模型筛选特征mRNA用于诊断早期肺癌的方法。首先对己知肺癌样本和正常样本的mRNA表达数据进行标准化处理,将其作为训练集。然后采用非相关线性判别分析对训练集进行建模,得到每个变量对应的转换矩阵G。将标准化后的待诊断样本作为预测集,将其mRNA表达数据与G矩阵相乘,得到非相关判别矢量值,从而进行肺癌样本的识别诊断。通过每个mRNA对应的G的绝对值大小筛选出特征mRNA,并不断调整筛选阈值以减少mRNA保留数量并更新肺癌诊断ULDA模型,直到预测集诊断准确度开始下降。诊断准确度为100%时,所筛选出的最少数目的mRNA可以作为肺癌诊断的潜在特征生物标记物。
技术领域
本发明涉及一种通过非相关线性判别分析筛选特征mRNA用于诊断早期肺癌的方法。
背景技术
癌症的早期诊断与及时治疗是提高癌症患者生存率的最有效途径。但癌症的早期诊断一直是困扰医务人员及相关科研人员的难题。肺癌是当前世界最常见、致死人数最多的恶性肿瘤之一,其发病率、增长速度亦高居各恶性肿瘤之首。肺癌早期症状不明显,目前临床一般通过X射线透视、计算机体层扫描等影像学检查及液体活检等手段,但往往确诊时,患者已经发展到中晚期。
由于癌症是一种由于细胞受到致癌因素影响发生基因突变所导致的疾病。正常细胞与癌细胞的基因表达存在差异,因此找到标志着细胞癌变的差异表达基因(标记物),可以作为癌症早期诊断的有效手段。随着高通量测序技术的快速发展及测试价格的下降,获得大量基因表达数据已不是难题。然而如何从庞大且复杂的基因表达数据中提取出癌症相关基因,对现有的数据处理和分析方法提出了挑战。而化学信息学恰恰是一个非常有效的解析途径。已有基于化学信息学方法结合基因表达数据建立偏最小二乘判别分析、支持向量机的模式识别(分类)模型,用于重要特征变量的筛选和癌症的识别。
mRNA(Messenger RNA)即信使核糖核酸,作为中间体将遗传信息从脱氧核糖核酸(DNA)传递到核糖体。目前已有报道mRNA在不同类型的肿瘤中异常表达。
发明内容
本发明的目的是提供一种筛选特征RNA用于诊断早期肺癌的方法,为肺癌的快速高效、准确地早期诊断提供新的途径。
将已确诊肺癌患者组和正常组作为训练集,将其mRNA表达数据进行标准化处理。然后,采用非相关线性判别分析(ULDA,uncorrelated linear discriminant analysis)方法对训练集进行建模,得到每个变量对应的转换矩阵G。G的维度为n×1,n为变量数目。将标准化后的待诊断样本作为预测集,将其mRNA表达数据与G矩阵相乘,得到非相关判别矢量值(UDV值)。当样本类别为二时,仅依据一个UDV值便可进行样本的分类识别。不同类样本的UDV值有较大差异,在空间上分别聚类。每个mRNA的重要性反映在矩阵G中对应值的大小,通过其对应的G的绝对值大小筛选出关键mRNA,并不断调整筛选阈值。每次筛选将原有的基因表达数据降维后,建立肺癌诊断模型,在准确识别肺癌组和对照组的前提下,逐步提高筛选阈值以减少mRNA保留数量,更新肺癌诊断模型,直到诊断准确度开始下降。保证准确诊断时,筛选的最少数目的mRNA可以作为早期诊断肺癌的潜在生物标记物。
具体步骤为:
1.将已知确诊肺癌患者组和正常组的mRNA表达数据进行标准化处理后,作为训练集;
2.令数据集X=(xij)∈Rn×p的每一行对应一个样本,每一列是相应mRNA的表达量,n为样本数,p为变量数,假设样本属于k类,样本的平均值为T表示矩阵的转置。非相关线性判别分析具体步骤如下
1)根据与计算得到Hb和Ht;
2)对进行奇异值分解,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学(保定),未经华北电力大学(保定)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911146308.6/2.html,转载请声明来源钻瓜专利网。