[发明专利]一种基于lincRNA表达谱组合特征的肾乳头状细胞癌早期预测方法在审
| 申请号: | 202010775535.1 | 申请日: | 2020-08-04 | 
| 公开(公告)号: | CN111944902A | 公开(公告)日: | 2020-11-17 | 
| 发明(设计)人: | 李文兴;刘大海;刘蕾娜;焦文乔 | 申请(专利权)人: | 佛山科学技术学院 | 
| 主分类号: | C12Q1/6886 | 分类号: | C12Q1/6886;G16B30/00;G16B25/10;G16B20/00;G16B40/20;G16H50/30 | 
| 代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 | 
| 地址: | 528000 *** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 lincrna 表达 组合 特征 乳头状 细胞 早期 预测 方法 | ||
本发明公开了一种特征lincRNA表达谱组合及肾乳头状细胞癌早期预测方法,lincRNA的核苷酸序列如SEQ ID NO.1‑SEQ ID NO.18所示。该方法包括以下步骤:获取肾乳头状细胞癌早期患者稳定差异表达的特征lincRNA;选取特征lincRNA表达数据,对每个样本进行数据标准化;使用支持向量机对标准化后的数据构建早期预测模型;根据患者特征lincRNA的表达水平进行早期预测。本发明具有很高的精确度和准确率(ROC曲线下面积AUC=0.988)。只需要获取上述18种lincRNA的相对表达量,就能计算出肾乳头状细胞癌早期患病概率,可作为肾乳头状细胞癌早期预测和治疗的参考依据。
技术领域
本发明属于生物技术和医学技术领域,具体地说,涉及一种基于lincRNA表达谱组合特征的肾乳头状细胞癌早期预测方法。
背景技术
肾乳头状细胞癌(kidney renal papillary cell carcinoma)约占肾细胞癌的15%。其发病年龄一般为50-70岁,男女患病比率为2-3.9:1。肾乳头状细胞癌预后较好,5年生存率能达到80%以上。全球疾病负担(Global Burden of Disease,GBD)数据显示,2017年全球患有肾癌的人数超过210万,其中中国患病人数约为27万。2017年全球患有肾癌的死亡人数约为14万,占总死亡人数的0.25%。中国2017年死亡患者数约为1.7万,占总死亡人数的0.16%。统计结果显示,从1990年到2017年全球肾癌患病率和死亡率持续增长。近十年来中国肾癌患病人数,患病率和死亡率相对稳定。
支持向量机(Support Vector Machine,SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。当训练数据是线性可分时,SVM通过硬间隔最大化学习进行分类。当训练数据线性不可分时,SVM通过使用核技巧以及软间隔最大化学习进行分类。SVM对于特征含义相似的中等大小的数据集很强大,也适用于小型数据集。通常情况下,对样本量小于1万的数据集SVM都有很好的预测效果。SVM在疾病诊断、肿瘤分类、肿瘤基因识别等有着广泛的应用。
肿瘤早期诊断一直是医学界的难题。现有的早期诊断方法多是观测某一个或一类标志物的表达水平,难以达到理想的诊断效果。由于这些标志物在肿瘤患者和正常人群中的表达分布有部分重叠,难以界定标志物的临界值将肿瘤患者和正常人群较好地分开。因此,利用多个标志物表达特征组合可能是肿瘤早期诊断的一种有效方法。长链基因间非编码RNA(long intergenic non-coding RNA,lincRNA)是一类位于基因间非编码序列的长度大于200个核苷酸的非编码单链RNA分子。lincRNA不具有编码潜力并且在不同物种之间不保守。研究表明lincRNA参与多个基因的表达调控,在人体内表达相对稳定且容易检测。由于单个lincRNA分子在肿瘤和正常人群中表达分布有重叠,难以界定早期诊断的临界值。
因此,有必要建立一种更稳定的多个差异lincRNA表达特征组合的预测模型将有助于肾乳头状细胞癌的早期预测。
发明内容
有鉴于此,本发明提供了一种基于lincRNA表达谱组合特征的肾乳头状细胞癌早期预测方法,能够准确地进行肾乳头状细胞癌I/II期预测。
为了解决上述技术问题,本发明公开了一种特征lincRNA表达谱组合,包括AC026401.3、AC040977.1、AC091563.1、AC104825.1、AF127577.4、ATP2B1-AS1、CRNDE、DNAJC3-DT、LINC00476、LINC01503、LINC02381、LINC02604、LINC02615、MIR210HG、MIR22HG、MIR4435-2HG、SEPT7-AS1和U91328.1,其核苷酸序列如SEQ ID NO.1-SEQ ID NO.18所示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010775535.1/2.html,转载请声明来源钻瓜专利网。





