[发明专利]基于矩阵分解和多划分对齐的医疗数据聚类方法及系统在审
申请号: | 202110705655.9 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113627462A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 朱信忠;徐慧英;刘新旺;李苗苗;涂文轩;李洪波;张长旺;葛铭;殷建平;赵建民 | 申请(专利权)人: | 浙江师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/16;G06N20/00 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 赵芳 |
地址: | 321004 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 矩阵 分解 划分 对齐 医疗 数据 方法 系统 | ||
本发明公开了基于矩阵分解和多划分对齐的医疗数据聚类方法及系统。其中涉及的基于矩阵分解和多划分对齐的医疗数据聚类方法,包括:S1.获取与医疗数据相对应的原始图像数据;S2.对获取的原始图像数据相对应的多视图数据通过多层矩阵进行分解,得到各个视图的基础划分矩阵;S3.利用列变换将得到的各个视图的基础划分矩阵进行融合对齐,得到一致融合后的划分矩阵;S4.将得到的各个视图的基础划分矩阵以及一致融合后的划分矩阵进行统一,并构建统一后划分矩阵相对应的目标函数;S5.采用交替优化方法优化构建的目标函数,得到优化后的统一划分矩阵;S6.对得到的优化后的统一划分矩阵进行谱聚类,得到最终的聚类结果。
技术领域
本发明涉及面向医疗诊断的多视图聚类技术领域,尤其涉及基于矩阵分解和多划分对齐的医疗数据聚类方法及系统。
背景技术
在实际的医疗诊断应用中,大多数医疗数据都是由不同视图构成的。例如在肺部图像诊断中,可以获得X射线视图、CT视图与核磁共振视图等多种信息源,研究者通过机器学习算法对多视图数据进行分析处理,来辅助医生诊断,从而提高医疗诊断的效率并达到减少医生的工作负担的目的。如上所述,通过样本的不同信息源或不同属性对其个体进行描述,我们称之为称为多视图数据,其对应处理多视图数据的聚类算法,称之为多视图聚类算法。由于对大量的医疗数据进行精准标注的成本十分高昂,多视图聚类作为一种重要的无监督数据分析方法,通过多视图聚类可以充分利用多个医疗视图之间的多样性和互补信息,此类算法对医疗辅助诊断的发展起着非常重要的作用,具有很好的研究与应用价值。
现有的多视图聚类算法可以通过基于模型的不同进一步分为四类:协同训练、多核学习、图聚类和子空间聚类。对于上述四种方法均可以使用早期融合基本思想进行视图融合。早期融合的主要思想是将多个视图的特征表示或图结构融合成一个公共的表示或者一个公共的图结构。例如,基于图的聚类方法在每个视图下构建样本相似性,然后通过随机行走策略融合这些图。多核学习方法通过线性或非线性组合融合多个基核以获得最佳的聚类核。子空间聚类的目的是为每个视图找到合适的低维表示或结构,然后将它们融合成一个包含丰富信息的公共表示或结构以用于聚类。另一方面,除了对视图进行早期融合还有后期融合的方式。该方法是将单个视图的聚类结果融合起来,也称为决策级融合。后期融合可以分为集成学习和协作式训练。集成聚类算法的输入是对应于多个视图的聚类结果。如在工作中,通过定义最终聚类结果与输入聚类结果之间的距离作为公共损失函数以来获得聚类结果。协作式训练的关注点是如何在协作式训练中获得更好的聚类结果。通过对每个视图进行谱嵌入获得多个聚类结果,并将获得的聚类结果用于影响其他视图的原始表示。此外将后期融合应用于多核k-means聚类,降低了算法的复杂性和时间成本。
NMF被广泛用于聚类,因为它有能力处理捕捉不同观点的基本表示。一些工作通过定义多样性来减少不同视图表示之间的冗余。此外,交叉熵成本函数和邻居信息均被引入以指导学习过程。尽管NMF可以很好地解决高维问题。但它在捕捉数据的内部结构方面似乎无能为力,因此后续的工作达到了保留通过添加图形正则化项以及流行的正则化项,达到保留数据空间的局部几何结构的目的。为了减少离群值的影响,在工作中必须引入流形正则化的范数。随着研究的发展,单层NMF聚类所提取的信息往往不能满足我们对数据信息挖掘的需要。为了探索数据中更深层次的隐藏信息,现有技术中提出了一个深度半NMF模型来探索具有隐含的低层隐藏属性的复杂层次信息。受深度半NMF的影响,模型DMVC学习了公共的该模型通过对原始数据结构的指导,学习包含深层信息的低维表征。最近,还提出了一种通过深度NMF方法进行多视图聚类的方法来自动学习每个视图的最佳权重。
当前传统现有的NMF方法通过学习具有丰富信息的低维表示实现了聚类性能的大幅提升,但它们仍然可以通过以下考虑进行改进虑的情况下得到改进。1)充分发挥原始数据的作用以获得更多的判别信息;2)重点关注视图之间的共享和视图之间的特定信息;3)改进的融合策略多视图信息的改进策略。
发明内容
本发明的目的是针对现有技术的缺陷,提供了基于矩阵分解和多划分对齐的医疗数据聚类方法及系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江师范大学,未经浙江师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110705655.9/2.html,转载请声明来源钻瓜专利网。