[发明专利]一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法及预后模型应用有效
| 申请号: | 201910114176.2 | 申请日: | 2019-02-14 |
| 公开(公告)号: | CN110010198B | 公开(公告)日: | 2022-12-20 |
| 发明(设计)人: | 王哲;朱家伟 | 申请(专利权)人: | 辽宁省肿瘤医院 |
| 主分类号: | G16B25/00 | 分类号: | G16B25/00 |
| 代理公司: | 沈阳亚泰专利商标代理有限公司 21107 | 代理人: | 史力伏 |
| 地址: | 110042 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及基因技术及生物医学领域,具体涉及肝细胞癌(HCC)中可变剪切(AS)事件的全转录组系统分析的方法以及基于全转录组分析方法的相关预后模型构建与应用。本发明通过在HCC中发生了剪接变异信号的全局辨识和生物信息学分析的全面描述,以及基于系统的全转录组分析方法的预后模型及剪切网络的构建。本发明提供了HCC中mRNA剪接特征的全局变化的综合图像,并进一步开发了包含存活相关AS事件的预后模型和剪接网络。本发明是对HCC AS事件特征进行全面综合计算研究的第一次尝试,并进一步扩展到预后和分子靶向意义的新领域,为阐明生物发生和HCC的发展的潜在遗传机制提供了新的见解。 | ||
| 搜索关键词: | 一种 基于 转录 肝细胞 可变 剪切 事件 系统分析 方法 预后 模型 应用 | ||
【主权项】:
1.一种基于全转录组的肝细胞癌可变剪切事件系统分析的方法,其特征在于,具体步骤如下:1)数据管理过:HCC队列的第三级mRNA测序数据和相应的临床信息获自TCGA数据门户http://tcga‑data.nci.nih.gov/,其包含374个HCC组织和50个相邻的非肿瘤组织;为了生成每个HCC患者的AS概况,使用一种明确量化每个外显子和剪接点的包含水平的Java应用程序即SpliceSeq来评估HCC患者的mRNA剪接模式,共纳入290名符合以下标准的患者:1)确诊HCC的组织学诊断;2)患者在初始病理诊断后至少30天仍存活;3)患者具有相应的mRNA剪接数据;从0到1的百分比拼接评分通常用于评估特定基因与特定剪接模式的转录物比率,为尽可能地生成一组AS事件,实施一系列严格的过滤器,PSI得分≥75的样本百分比,PSI得分平均值≥0.05,并且使用k‑最近邻居估算了缺失的表达值算法与impute包;为准确描述AS事件,为每个AS事件分配了一个唯一的注释,该注释由SpliceSeq中的剪接类型,ID号和匹配的基因符号组成;2)HCC患者的生存分析和预后特征的构建:根据中位数切点,将HCC患者AS事件的PSI评分分为低指数和高指数,然后进行适合分类PSI指数和患者总生存的单变量Cox回归分析,以确定预后AS事件;UpSetR是一个用于生成镦粗图的R包,可以可视化七种类型的生存相关AS事件之间的交叉集,前20名最重要的生存相关选择每种AS类型的AS事件作为搜索独立预后因子的候选者,并分别通过多变量Cox回归进一步构建HCC患者的AS特征,每个预后特征选择通过前向逐步选择过程和Akaike信息标准(AIC)进行,然后将每个AS特征中识别的AS事件组合起来,通过二级前向逐步方法构建最终预测模型,以找到最小的AS事件集,其中使用以下方法计算OS预测的每个AS特征的风险评分:
,此外根据中位风险评分将HCC患者分为低风险和高风险亚组,并进行Kaplan‑Meier生存分析以区分这两个亚组,此外每个预后模型的临床疗效和预测准确性是可比拟的,拟合时间依赖性ROC曲线与survivalROC包,并且分别计算1年,3年和5年的曲线下面积;3)生存相关AS事件的功能丰富和相互作用分析:通过单变量Cox回归分析确定的存活相关AS事件的亲本基因通过设定错误发现率(FDR)<0.05进行基因本体论(GO)和京都基因百科全书和基因组(KEGG)途径分析,上述分析使用clusterProfiler包‑版本3.7进行,此外通过使用Reactome FI Cytoscape PlugIn‑版本3.6.1分析和可视化基因相互作用网络,目的是搜索重要的中枢基因;4)HCC队列中潜在的SF‑AS监管网络:通过筛选文献和SpliceAid2数据库鉴定总共67个SF,并且使用DESeq2包将TCGA HCC样品中的相应表达水平用“方差稳定转化功能”整合和标准化;然后进行单变量Cox危害回归以筛选独立的预后SF;还进行存活相关SF的表达与预后AS事件的PSI评分之间的Spearman相关性分析; P值由Benjamini&Hochberg(BH)相关调整,调整后的P值<0.001被认为是显着的,由Cytoscape生成SF‑AS监管网络;5)SF‑AS相关对的基因集变异分析:GSVA是一种差异功能基因集富集分析,可通过计算样本方式基因集富集分数来检测异质样本的细微途径活性变化,使用来自bioconductor‑www.bioconductor.org的GSVA包进行GSVA以进一步从HCC组织中搜索显着富集的GO和经典途径,其中经典途径包括KEGG、Reactome和BioCarta途径数据库,从www.broadinstitute.org‑Molecular Signatures Database下载,然后使用limma包进行肿瘤与邻近正常样本之间的差异基因集分析,并且对于GO术语,| logFC |> 0.4和FDR <0.05,以及| logFC |> 0.2且FDR <0.05用于途径组分别具有统计学意义,将GSVA结果的火山图和热图可视化并显示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁省肿瘤医院,未经辽宁省肿瘤医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910114176.2/,转载请声明来源钻瓜专利网。





