[发明专利]一种鲁棒自动加权多特征聚类方法在审
| 申请号: | 201810325323.6 | 申请日: | 2018-04-12 |
| 公开(公告)号: | CN108764276A | 公开(公告)日: | 2018-11-06 |
| 发明(设计)人: | 肖云;王长青;任鹏真;雷文龙;高颢函;许鹏飞;郭军;王欣;陈晓江;房鼎益 | 申请(专利权)人: | 西北大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 张明 |
| 地址: | 710069 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 鲁棒 视图聚类 特征聚类 相似矩阵 加权 后处理 处理数据 合成数据 实际数据 权重 标签 测量 学习 引入 | ||
本发明提出了一种鲁棒自动加权多特征聚类方法,用于处理数据集中异常值的多视图聚类问题。在提出的方法中,采用鲁棒L1标准来测量最终学习相似矩阵的距离和不同视图的相似矩阵之间的距离,通过引入超参数来学习权重,使用最好的超参数,该方法直接获得每个数据点的簇标签,而无需任何后处理,如K‑means;通过对两个合成数据集的评价表明了该方法的有效性。与基于四种实际数据集的多视图聚类方法相比,本方法的性能优于其他所有的比较方法。
技术领域
本发明属于计算机图像处理技术领域,具体是合计一种鲁棒自动加权多特征聚类方法,用于处理多视图聚类问题。
背景技术
随着互联网和大数据时代的到来,在机器学习中广泛存在着关于多视图数据的聚类任务。如何依据最初输入的多视图数据对原始的数据进行聚类是以至关重要的。例如,对于一个图片的聚类,我们可以从颜色、尺寸、纹理等多个角度对图片的特征进行描述。
通过将多视图数据集X转化为无向图当中的节点,依据每对数据点之间的相似度为节点之间的边赋相应的权重,从而实现多视图数据集向图的转化,每个图都代表研究对象一个视图,通过将多个视图进行相应的整合,来完成最终的聚类任务,生成标记矩阵。
在多视图学习中,如果存在质量较差的视图,则会严重影响聚类结果;而对于视图中存在的噪声或异常值,现有聚类方法对抗干扰能力比较差。因此,如何设计一个健壮的方法是多视图聚类任务的关键。
发明内容
传统的基于图的半监督学习方法普遍存在对于噪声过于敏感的现象,一些相对较小的噪声会对最终的聚类结果产生很坏的影响。为解决现有技术存在的问题,本发明提供一种鲁棒自动加权多特征聚类方法。
本发明的技术方案如下:
步骤1,构建原始多视图数据集X={X(1),X(2),...,X(m)}的邻接矩阵集A={A(1),A(2),...,A(m)},其中A(v)表示X(v)对应的邻接矩阵,邻接矩阵A中的元素表示第v个视图X(v)中的第i个数据节点xi与第j个数据节点xj的之间的相似度,v=1,2,…,m,m表示视图个数;
步骤2,引入相似矩阵S,并建立目标函数:
s.t.α(ν)≥0,αT1m=1,sij≥0,si1n=1,rank(Ls)=n-c.
上式中,S表示相似矩阵,A(v)表示邻接矩阵A的第v个视图,sij表示相似矩阵S的第i行第j个元素,α(v)为视图权重向量α的第v个元素,1m表示有m个元素的单位列向量,αT1m=1表示视图权重向量α的所有元素之和为1,1n表示n行1列的单位向量,si1n=1表示相似矩阵S的每一行之和等于1,Ls是相似矩阵S的拉普拉斯矩阵,rank(Ls)是拉普拉斯矩阵Ls的秩,c表示相似矩阵S中连通子图的个数,||·||1表示L1范数;
步骤3,对目标函数进行正则化,得到正则化后的目标函数:
s.t.α(ν)≥0,αT1m=1,sij≥0,si1n=1,rank(LS)=n-c.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810325323.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:叶片病害的识别方法和系统
- 下一篇:一种无参考图像模糊质量评价算法





