[发明专利]一种基于鲁棒的对称非负矩阵分解的微生物数据聚类方法在审
| 申请号: | 202111026627.0 | 申请日: | 2021-09-02 |
| 公开(公告)号: | CN113723537A | 公开(公告)日: | 2021-11-30 |
| 发明(设计)人: | 睢丹;魏晨希;刘芃兰 | 申请(专利权)人: | 安阳师范学院 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/16 |
| 代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 韩迎之 |
| 地址: | 455000 *** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 对称 矩阵 分解 微生物 数据 方法 | ||
本发明公开了一种基于鲁棒的对称非负矩阵分解的微生物数据聚类方法,涉及微生物数据聚类技术领域,具体步骤包括如下:采集样本数据;对所述样本数据构建样本相似性矩阵;利用相似性网络融合算法来整合所述样本相似性矩阵,获得融合矩阵;通过鲁棒的对称非负矩阵分解算法对所述融合矩阵进行聚类,为所述样本数据分配标签。本发明提出了一种基于相似网络融合和对称非负矩阵分解的数据整合框架RSNMF,用于聚类微生物组数据,有效避免了噪音的影响。
技术领域
本发明涉及微生物数据聚类技术领域,更具体的说是涉及一种基于鲁棒的对称非负矩阵分解的微生物数据聚类方法。
背景技术
近年来,高通量测序技术的进步使得规模收集多种异构微生物组数据成为可能。研究微生物之间以及微生物组与宿主环境之间的互作用关系,这在理解微生物组与人类疾病的关系方面已显示出越来越重要的价值。许多微生物组项目的发起,包括人类微生物组计划(HMP),人类肠道宏基因组计划(MetaHIT)等,积累了大量数据。然而,由于微生物组数据中存在大量噪声及其异质性,很少有方法将多源异构的微生物数据整合起来,以研究微生物群落的组份和功能。因此,迫切需要设计新的数据整合方法来研究复杂的微生物组学数据。
在文本挖掘和图像处理领域,出现了许多新颖的方法来整合多视角数据。多视角非负矩阵分解(multi-NMF)和联合非负矩阵因式分解(JNMF)试图寻找所有视图共享的一致和有意义的聚类解。协同训练谱聚类算法试图通过迭代更新每个视图的特征向量来找到兼容的聚类解。相似性网络融合(SNF)有效地构建了一个融合网络,该网络代表了不同视图的潜在模式。SNF是一种有效的方法,已应用于许多领域,如图像检索,癌症分型和生存预测。但是,在为每种视图的数据类型建立相似性网络的阶段,SNF使用高斯核和K最近邻(KNN)方法,这对于所有类型的数据并不是适用的。
另一种有效的聚类方法是对称非负矩阵分解(SNMF)。SNMF可以用于图聚类,并且通常比谱方法和NMF表现要好。SNMF的性能和相似性计算方法有密切的关系。ClustRF构建了鲁棒的相似性网络,能够有效捕获特征之间的相关性,但是计算复杂性高,随样本的大小以及特征和训练树的数量呈指数增长。
现有技术中进行微生物聚类的方法都存在相应的弊端,因此,对本领域技术人员来说,如何避免噪音干扰对多视角微生物数据进行有效整合是亟待解决的技术问题。
发明内容
有鉴于此,本发明提供了一种基于鲁棒的对称非负矩阵分解的微生物数据聚类方法,结合SNMF和SNF的优势,形成鲁棒的聚类指挥矩阵,有效避免噪声的影响。
为了实现上述目的,本发明采用如下技术方案:一种基于鲁棒的对称非负矩阵分解的微生物数据聚类方法,具体步骤包括如下:
采集样本数据;
对所述样本数据构建样本相似性矩阵;
利用相似性网络融合算法来整合所述样本相似性矩阵,获得融合矩阵;
通过鲁棒的对称非负矩阵分解算法对所述融合矩阵进行聚类,为所述样本数据分配标签。
优选的,对于微生物组数据,采用高斯核函数构建样本相似性矩阵,公式为:
其中,vi表示第i个样本,wij表示样本i与样本j之间的相似性,μ表示参数,μ=0.5,σij表示缩放参数,Eij表示第i个节点与第j个节点之间的距离,mean(E(j,Nj))表示第i个节点与其邻居之间距离的均值。
优选的,所述相似性网络融合算法的具体计算步骤为:
通过所述样本相似性矩阵得到标准化的亲邻矩阵;
利用KNN算法定义核矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安阳师范学院,未经安阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111026627.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于鞋盒打包的自动装箱装置
- 下一篇:一种基于NLP算法的关系分析方法





