[发明专利]一种多组学数据聚类方法及装置有效

专利信息
申请号: 202010019135.8 申请日: 2020-01-08
公开(公告)号: CN111223528B 公开(公告)日: 2023-04-18
发明(设计)人: 蔡宏民;容文滔 申请(专利权)人: 华南理工大学
主分类号: G16B40/30 分类号: G16B40/30
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 郭浩辉;麦小婵
地址: 510000*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多组学 数据 方法 装置
【说明书】:

发明公开了一种多组学数据聚类方法,包括:获取待测样本的多个原始组学数据,并对所述原始组学数据进行标准化,得到组学数据;构建每个所述组学数据的局部相似矩阵;将所述局部相似矩阵输入到预设的谱聚类模型,得到每个所述组学数据的聚类结果,并基于所述聚类结果更新所述局部相似矩阵;根据更新后的局部相似矩阵建立优化模型,并通过求解所述优化模型,得到全局相似度矩阵;将所述全局相似度矩阵输入到所述谱聚类模型,得到所述待测样本的亚型识别结果。本发明还公开了一种多组学数据聚类装置,能有效解决现有技术没有考虑不同组学的权重,及基于谱聚类的算法没有利用到由谱聚类得到的多个子图的节点路径信息导致影响分型准确性的问题。

技术领域

本发明涉及多组学整合技术领域,尤其涉及一种多组学数据聚类方法及装置。

背景技术

高通量测序的发展加速了来自多个来源的组学数据在同一肿瘤组织上的积累。癌症亚型鉴定已成为多组学研究的主要临床应用。它可以提供对疾病发病机理的更深入了解以及针对性疗法的设计,多组学整合聚类是从多组学数据中识别癌症亚型的主要工具。多组学整合存在以下挑战:1、高维度小样本;2、如何恰当整合不同组学的信息;3、每个组学数据在规模,维度和质量上的异质性。整合多组学的方法可以大致分为三类:1、基于相似度的方法;2、基于降维的方法;3、统计方法。基于相似性的方法是使用样本之间的相似度来聚类数据,由于在当前的多组学数据中,样本数量远远小于特征数量,基于相似性的方法是通常比考虑特征的方法要快。例如相似度网络融合(SNF)根据消息传递融合从他们的每种数据类型获得的患者相似性网络。Grassmanncluster在格拉斯曼流形上合并每种组学数据的子空间表示(由谱聚类得到),来获得一个综合的子空间表示,在该子空间中实现对癌症患者分型。

但现有技术没有考虑不同组学的权重,基于谱聚类的算法没有利用到由谱聚类得到的多个子图的节点路径信息,因此影响了癌症分型的准确性,而且学习的相似度矩阵不具备好的解释性以及与尺度无关的特性。

发明内容

本发明实施例提供一种多组学数据聚类方法及装置,能有效解决现有技术没有考虑不同组学的权重,及基于谱聚类的算法没有利用到由谱聚类得到的多个子图的节点路径信息导致影响分型准确性的问题,能有效提高分型的准确性。

本发明一实施例提供一种多组学数据聚类方法,其特征在于,包括:

获取待测样本的多个原始组学数据,并对所述原始组学数据进行标准化,得到组学数据;

构建每个所述组学数据的局部相似矩阵;

将所述局部相似矩阵输入到预设的谱聚类模型,得到每个所述组学数据的聚类结果,并基于所述聚类结果更新所述局部相似矩阵;

根据更新后的局部相似矩阵建立优化模型,并通过求解所述优化模型,得到全局相似度矩阵;

将所述全局相似度矩阵输入到所述谱聚类模型,得到所述待测样本的亚型识别结果。

作为上述方案的改进,所述构建每个所述组学数据的局部相似矩阵,具体包括:

所述局部相似矩阵由以下公式确定,具体公式如下:

Z(i,j)=(Z(i,j)+Z(j,i))/2

其中,

Z为所述局部相似矩阵,W(i,j)为待测样本i与待测样本j的高斯核相似度,W(i,k)为待测样本i与待测样本k的高斯核相似度,d(xi,xj)为待测样本i与待测样本j之间的欧式距离,μ为用于控制指数衰减速度的比例常数,∈i,j矫正度量误差参数,Ni为待测样本K的最近邻集合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010019135.8/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top