[发明专利]一种多组学数据的聚类分析方法和系统在审
| 申请号: | 202110644202.X | 申请日: | 2021-06-09 |
| 公开(公告)号: | CN113392894A | 公开(公告)日: | 2021-09-14 |
| 发明(设计)人: | 怀晓晨;穆红章 | 申请(专利权)人: | 瓴域影诺(北京)科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
| 代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 陈晨 |
| 地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多组学 数据 聚类分析 方法 系统 | ||
本申请实施例公开了一种多组学数据的聚类分析方法和系统,通过采用神经网络对MR影像信息进行分割,根据各部分分割信息,提取高通量影像超参数;对临床数据、人口学数据和实验室检查数据进行处理,生成不同维度的向量表示;将所述高通量影像数据和所述不同维度的向量表示进行多源数据融合,得到融合后的多源异构数据;构建多源异构数据集,通过训练并测试多源图聚类模型,得到最优模型;将MR影像信息输入到所述最优模型中,分析不同类别差异性和同一类别相似性。采用图结构的方式,直观表达数据之间的关联情况,捕捉不同的特征,模型更鲁棒,实现基于图神经网络模型的高效聚类算法,具有很高的实用价值。
技术领域
本申请实施例涉及数据分析技术领域,具体涉及一种多组学数据的聚类分析方法和系统。
背景技术
近年来,多组学分析已广泛应用于医学亚型分析上,高通量数据融合,准确定义亚型,已成为精准医疗的重要话题。目前多组学融合面临着很多问题,如数据庞杂、数据稀疏、数据异质等。数据融合的方法可分为相似性方法、基于降维方法、基于统计的方法。
基于相似性的方法是使用样本之间的相似度来聚类数据,由于在当前的多组学数据中,样本数量远远小于特征数量,基于相似性的方法在样本量不足的情况下,很难有较好的效果。基于谱聚类的算法没有利用节点路径信息,影响了聚类的准确性。
发明内容
为此,本申请实施例提一种多组学数据的聚类分析方法和系统,采用图结构的方式,直观表达数据之间的关联情况,捕捉不同的特征,模型更鲁棒,实现基于图神经网络模型的高效聚类算法,具有很高的实用价值。
为了实现上述目的,本申请实施例提供如下技术方案:
根据本申请实施例的第一方面,提供了一种多组学数据的聚类分析方法,所述方法包括:
采用神经网络对MR影像信息进行分割,根据各部分分割信息,提取高通量影像超参数;
对临床数据、人口学数据和实验室检查数据进行处理,生成不同维度的向量表示;
将所述高通量影像数据和所述不同维度的向量表示进行多源数据融合,得到融合后的多源异构数据;
构建多源异构数据集,通过训练并测试多源图聚类模型,得到最优模型;
将MR影像信息输入到所述最优模型中,分析不同类别差异性和同一类别相似性。
可选地,所述将所述高通量影像数据和所述不同维度的向量表示进行多源数据融合,得到融合后的多源异构数据,包括:
添加MR定位定量开采的影像组学超参数,将四种不同类型的数据进行预处理,基于对应的每个特征进行归一化处理;
对预处理后的四种数据进行数据对齐;
将对齐后的数据进行关联,针对每一个组学样本分别构建关联矩阵,通过局部高斯核构建相似性度量指标,计算每个关联矩阵的相邻样本,过滤权重小于设定范围的数据,得到过滤后的多组学信息的关联矩阵;
利用随机游走算法融合不同组学的关联矩阵。
可选地,所述通过训练并测试多源图聚类模型,得到最优模型,包括:
采用多源图聚类模型实现聚类分析,对节点的局部邻居的特征进行采样和聚合,生成节点表示;
利用节点对的内积运算重构原始网络结构,结合注意力机制学习邻居节点的权重,以使得自动学习特征;
在模型训练过程中,采用自训练聚类模块,以实现对图嵌入的约束和整合,对构建的多源图聚类模型进行训练和验证,调整和优化网络参数,以实现多源图聚类模型的训练和收敛。
可选地,所述将MR影像信息输入到所述最优模型中,分析不同类别差异性和同一类别相似性,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瓴域影诺(北京)科技有限公司,未经瓴域影诺(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110644202.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





