[发明专利]一种基于相似度融合的多组学癌症数据整合分析方法有效

专利信息
申请号: 201910174117.4 申请日: 2019-03-08
公开(公告)号: CN109994200B 公开(公告)日: 2021-01-19
发明(设计)人: 蔡宏民;徐傲丹 申请(专利权)人: 华南理工大学
主分类号: G16H50/20 分类号: G16H50/20;G16B20/00
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 冯炳辉
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 相似 融合 多组学 癌症 数据 整合 分析 方法
【说明书】:

发明公开了一种基于相似度融合的多组学癌症数据整合分析方法,该方法包括计算局部相似度网络、多个局部相似度网络融合、根据全局相似度网络进行分型、根据全局相似度网络回溯原始的数据源中的特征四个步骤。对比当前技术,本发明通过对逐步递进的相似度网络连接路径建模,实现了多个相似度网络的融合算法,相比于现有技术能够刻画更为复杂的网络结构,具有更高的精确度和更好的稳定性。通过一致性交替乘子法实现了网络融合模型的快速求解。本发明不仅将整合的全局相似度网络运用于癌症患者的分型,得到预后显著差异的患者分型,并且结合了一种多集群特征选择方法辅助进行关键靶点特征的筛选,选出的特征有望成为潜在的生物标记物。

技术领域

本发明涉及生物信息的技术领域,尤其是指一种基于相似度融合的多组学癌症数据整合分析方法。

背景技术

在目前的临床医疗实践中,癌症往往是根据其组织来源以及病理学特征进行分型治疗。然而随着测序技术以及人类基因组研究的发展,大量研究表明肿瘤在分子级别的病理系统能够良好表征其发生特性及发展阶段。肿瘤发生发展的过程往往伴随着由体细胞基因突变、表观遗传学变化、个体差异和环境影响造成的基因组变异,传统的基于单个基因组数据的分析很难捕捉到所有生物过程的异质性,并清晰区分表型。因此,基于多组学数据(如基因表达,miRNA表达,DNA甲基化等)整合的数据分析能够弥补单一数据的信息缺失,矫正单一数据收集过程中的错误信息,为癌症分子级分析提供全面的视角,极大地推动肿瘤精准医学的发展。

尽管在全球范围的各个癌症测序项目的推动下积累了海量的癌症多组学数据集,包括肿瘤中体细胞突变的目录(COSMIC),国际癌症基因组协会(ICGC)和癌症基因图谱(TCGA)等数据库,有效地整合多组学数据仍然是一项巨大的挑战。近年来有关多组学数据整合的方法主要分为三种思路1)基于隐变量表达的方法2)基于概率模型的方法3)基于网络结构的方法。其中基于隐变量表达的方法假设不同的组学数据之间存在若干公共的隐藏变量,从而将不同数据集中的高维特征映射到一个公共的低维空间上。例如iCluster+建立了隐变量与观测值之间的正则化回归模型,联合非负矩阵分解(jNMF)通过矩阵分解的方法寻找多个数据集所公有的特征空间等。然而该类方法在不同组学数据的维度和尺度差异过大时难以找到一个公共的映射,并且隐变量也缺乏对应的生物学意义。基于概率模型的整合方法主要是假设不同组学、不同分型的患者分别服从不同的先验概率分布,估计其混合之后的分布情况。例如贝塔-高斯混合模型分别用贝塔分布以及高斯分布拟合基因表达数据和蛋白-DNA关联概率并将其整合到同一个概率混合模型中。但是高维数据的混合概率模型需要估计的参数过多,当样本数量远小于特征数量时会出现过拟合的情况,影响估计精度。基于网络结构的方法使用图论基础构建每个数据来源的内部网络结构,并根据信息传播理论进行不同数据源的信息传递与交换。例如相似度网络融合(SNF)为每个单一数据集构建相似度网络,并迭代更新每一个相似度网络最终实现多个数据集的融合。基于网络的方法主要问题是对于网络结构和传递路径的建模简单无法刻画多组学数据的复杂网络结构,并且没有提供将融合后结果反馈到原始的组学数据的方法。因此对于维度高,噪音大,分布各异的癌症多组学数据,仍然缺乏高效精准鲁棒性高的整合方法用以癌症分子层面的分析。

发明内容

本发明的目的在于克服现有技术的缺点与不足,提出了一种基于相似度融合的多组学癌症数据整合分析方法,能够实现对于癌症患者的多组学数据(基因表达,miRNA表达,DNA甲基化等)的全面整合,对癌症患者作出预后差异显著的分型,并且依据分型结果定位原始数据特征,寻找有预后价值的生物标志物。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910174117.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top