[发明专利]食管癌相关特征通路的识别及早期预测模型的构建方法有效

专利信息
申请号: 201711222069.9 申请日: 2017-11-29
公开(公告)号: CN109841280B 公开(公告)日: 2023-07-21
发明(设计)人: 赵杰;薛文华;范智蕊;李砺锋;翟运开;张腾飞;田鑫;张超奇;宋晓琴;马丙钧;朱子家;沈志博;梁淑红 申请(专利权)人: 郑州大学第一附属医院
主分类号: G16H50/20 分类号: G16H50/20;G16H50/30
代理公司: 常州佰业腾飞专利代理事务所(普通合伙) 32231 代理人: 高姗
地址: 450001 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于肿瘤诊断技术领域,具体涉及食管癌相关特征通路的识别及早期诊断模型的构建方法,具体包括表达谱预处理、差异表达基因提取、样本聚类分析、基因聚类分析、特异基因集功能通路分析、通路失常得分比较、功能差异比较分析、食管癌特异性共表达网络构建、对基因进行特征选择和深度学习模型预测等步骤。本发明方法将基因根据其表达相似性和功能一致性划分为不同的分组,以基因集合的形式进行分析,一方面可以避免传统方法中假阳性率高、随机误差大、结果不稳定等缺点,另一方面也可以更加特异性的识别出和食管癌显著相关的功能。
搜索关键词: 食管癌 相关 特征 通路 识别 早期 预测 模型 构建 方法
【主权项】:
1.一种食管癌相关特征通路的识别及早期诊断模型的构建方法,其特征在于:包括以下步骤:(1)表达谱预处理:从GEO数据库https://www.ncbi.nlm.nih.gov/geo/下载人类食管癌表达谱数据GSE100843,GSE100843共包含76个样本,其中40个be segment,36个正常对照组织normal squamous mucosa用control表示,将所有表达值经过z检验标准化校正,校正过程包括计算control组中的表达均值μ和标准差sd,然后利用公式1对所有样本的表达值进行校正,其中,adj.exp为标准化校正后的表达值,exp为原始表达值,μ为基因表达均值,sd为标准差;(2)差异表达基因提取:以正常normal squamous mucosa样本作为对照组,be segment作为实验组,通过limma Rpackage计算基因显著性,以显著性P值小于0.01且logFC超出5%和95%分位数的基因作为显著差异表达的基因;(3)样本聚类分析:利用差异表达基因对所有食管癌样本和正常对照样本进行层次聚类,聚类过程通过R heatmap package实现,相似性矩阵采用pearson相关系数算法,最后通过热图的形式可视化;(4)基因聚类分析:先利用主成分分析识别出最大的三个主成分,然后利用前三个主成分结合mclust算法对基因进行聚类,根据BIC准则评价最优的分类个数,以及每个基因聚类对应的基因集;(5)特异基因集功能通路分析:利用每个子集内的基因进行功能富集分析,分析方法采用fisher exact test,每个基因子集可能富集到多个生物学功能,选择显著性最强的前两个功能来描述这个基因子集的主要功能,取显著性P值小于0.05的功能通路作为显著通路;(6)通路失常得分比较:采用欧氏距离的量化方法计算通路失常得分,比较通路相对于正常样本在食管癌样本中的动态功能变化;(7)功能差异比较分析:利用所有正常样本的失常得分计算均值μ和标准差sd,然后对于每个样本都做Z检验校正,若某个样本失常得分显著高,则信号在Z检验下被放大,反之则信号被削弱,对正常样本和食管癌两组失常得分做wilcox检验,根据显著性阈值p<0.05识别出食管癌相关的功能,这些筛选出的功能自身在食管癌发生过程中发生明显功能水平的偏差,或发生功能亢进,或被抑制,同时参与调控这些功能的基因也发生明显差异表达;(8)食管癌特异性共表达网络构建:将差异表达基因随机两两组合并计算在所有样本中的Pearson相关系数,根据所有基因对的相关系数分布设定阈值,超过阈值的基因对认为存在共表达相关性,根据任意两基因之间的共表达相关性构建系统网络,通过对网络拓扑性质的分析,识别网络中hub基因,这些基因在网络中具有较高的度或介数;(9)对基因进行特征选择:利用遗传算法模拟生物进化过程,通过亲本染色体重组过程,淘汰适应度低的子代,扩增适应度强的子代,从而优化出最适合的遗传信息组合,将所有特征基因随机组合形成特征链,初始化特征链长度为特征总数的50%,然后抽取一对特征链进行重组,使得子代特征链同时包含了来自亲本的特征信息,并计算子代适应度,用高适应度的子代特征链淘汰低适应度的子代特征链,此过程循环直至达到最大进化代数或模型收敛找到最优特征链,最后获得最优特征基因组合;(10)深度学习模型预测:利用遗传算法对特征基因进行进化筛选,获得食管癌显著相关的基因组合,利用这些特征基因在两组样本中的表达值作为特征值,结合神经网络深度学习模型进行训练并预测,对分析数据随机排序,取50%作为训练集,余下50%作为测试集,训练过程利用gridsearch算法进行参数优化,优化参数包括激活函数,隐含层层数,学习速率,最后通过ROC曲线评价模型分类预测效能。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学第一附属医院,未经郑州大学第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711222069.9/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top