[发明专利]一种交叉图匹配不完整多视图聚类方法及装置有效
申请号: | 202110453720.3 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113221974B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 陈川;赖俞静;郑子彬 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 苏云辉 |
地址: | 510275 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交叉 匹配 完整 视图 方法 装置 | ||
本申请公开了一种交叉图匹配不完整多视图聚类方法及装置,方法包括:建立不完整多模态数据的缺失值填充模型,多模态数据包括网页数据或者多媒体数据;建立不完整多模态数据的交叉图匹配模型;结合缺失值填充模型和交叉图匹配模型的目标函数,建立交叉图匹配不完整多视图聚类模型;将交叉图匹配不完整多视图聚类模型分解为三个子问题,包括优化缺失矩阵E,求解映射空间U以及更新连接矩阵S;采用迭代算法求解三个子问题直到三个子问题收敛,求得最优解。本申请在减少缺失数据的影响的同时,利用模态间一致和互补的信息来使得聚类效果得到提升。
技术领域
本申请涉及图像聚类技术领域,尤其涉及一种交叉图匹配不完整多视图聚类方法及装置。
背景技术
在大数据时代,数据采集渠道与特征提取的种类日益多样,使得同一对象可以从多种数据源、特征进行描述,产生多模态数据,例如一个网页数据可以由文本来刻画,同时也可以由指向该页面的超链接来描述;一个多媒体片段数据可以由其视频和音频信号同时描述。在实际应用中,由于标签采集费时费力,往往只能采集到少量监督信息,而多模态半监督聚类方法能将有限的监督信息与大量的无监督信息结合起来学习,大大地提升了聚类效果。
然而在实际应用中,由于数据采集器的临时失效或者人为失误,导致某些模态的数据缺失,往往会得到不完整的多视图数据。现有的多模态聚类算法大多基于完整数据而设计,无法直接处理不完整多模态数据,因此不完整多模态聚类应运而生,旨在减少缺失数据的影响的同时,利用模态间一致和互补的信息来使得聚类效果得到提升。
发明内容
本申请实施例提供了一种交叉图匹配不完整多视图聚类方法及装置,使得在减少缺失数据的影响的同时,利用模态间一致和互补的信息来使得聚类效果得到提升。
有鉴于此,本申请第一方面提供了一种交叉图匹配不完整多视图聚类方法,所述方法包括:
建立不完整多模态数据的缺失值填充模型,所述多模态数据包括网页数据或者多媒体数据;
建立不完整多模态数据的交叉图匹配模型;
结合所述缺失值填充模型和所述交叉图匹配模型的目标函数,建立交叉图匹配不完整多视图聚类模型;
将所述交叉图匹配不完整多视图聚类模型分解为三个子问题,包括优化缺失矩阵E,求解映射空间U以及更新连接矩阵S;
采用迭代算法求解所述三个子问题直到三个子问题收敛,求得最优解。
可选的,所述缺失值填充模型的目标函数为:
式中,X(v)为不完整模态数据,X(v)∈Rdv×N,dv是第v个模态的特征维度,{E(1),E(2),...,E(m)}表示多个模态的缺失数据,其中E(v)∈Rdv×nv,nv是第v个模态的缺失样本数,(N-nv)是第v个模态实际样本数;关系矩阵W(v)∈Rnv×N,如果E(v)中第i个节点是X(v)中第j个节点,那么反之为0;U(v)∈Rdv×N,v=1,2,...,m表示多模态数据的映射空间;λ1>0是权衡参数;是G(v)的拉普拉斯矩阵,特征相似性矩阵G(v)∈Rdv×dv由互knn图构建。
可选的,所述交叉图匹配模型的目标函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110453720.3/2.html,转载请声明来源钻瓜专利网。