[发明专利]一种鲁棒自动加权多特征聚类方法在审

专利信息
申请号: 201810325323.6 申请日: 2018-04-12
公开(公告)号: CN108764276A 公开(公告)日: 2018-11-06
发明(设计)人: 肖云;王长青;任鹏真;雷文龙;高颢函;许鹏飞;郭军;王欣;陈晓江;房鼎益 申请(专利权)人: 西北大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 西安恒泰知识产权代理事务所 61216 代理人: 张明
地址: 710069 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 鲁棒 视图聚类 特征聚类 相似矩阵 加权 后处理 处理数据 合成数据 实际数据 权重 标签 测量 学习 引入
【说明书】:

发明提出了一种鲁棒自动加权多特征聚类方法,用于处理数据集中异常值的多视图聚类问题。在提出的方法中,采用鲁棒L1标准来测量最终学习相似矩阵的距离和不同视图的相似矩阵之间的距离,通过引入超参数来学习权重,使用最好的超参数,该方法直接获得每个数据点的簇标签,而无需任何后处理,如K‑means;通过对两个合成数据集的评价表明了该方法的有效性。与基于四种实际数据集的多视图聚类方法相比,本方法的性能优于其他所有的比较方法。

技术领域

本发明属于计算机图像处理技术领域,具体是合计一种鲁棒自动加权多特征聚类方法,用于处理多视图聚类问题。

背景技术

随着互联网和大数据时代的到来,在机器学习中广泛存在着关于多视图数据的聚类任务。如何依据最初输入的多视图数据对原始的数据进行聚类是以至关重要的。例如,对于一个图片的聚类,我们可以从颜色、尺寸、纹理等多个角度对图片的特征进行描述。

通过将多视图数据集X转化为无向图当中的节点,依据每对数据点之间的相似度为节点之间的边赋相应的权重,从而实现多视图数据集向图的转化,每个图都代表研究对象一个视图,通过将多个视图进行相应的整合,来完成最终的聚类任务,生成标记矩阵。

在多视图学习中,如果存在质量较差的视图,则会严重影响聚类结果;而对于视图中存在的噪声或异常值,现有聚类方法对抗干扰能力比较差。因此,如何设计一个健壮的方法是多视图聚类任务的关键。

发明内容

传统的基于图的半监督学习方法普遍存在对于噪声过于敏感的现象,一些相对较小的噪声会对最终的聚类结果产生很坏的影响。为解决现有技术存在的问题,本发明提供一种鲁棒自动加权多特征聚类方法。

本发明的技术方案如下:

步骤1,构建原始多视图数据集X={X(1),X(2),...,X(m)}的邻接矩阵集A={A(1),A(2),...,A(m)},其中A(v)表示X(v)对应的邻接矩阵,邻接矩阵A中的元素表示第v个视图X(v)中的第i个数据节点xi与第j个数据节点xj的之间的相似度,v=1,2,…,m,m表示视图个数;

步骤2,引入相似矩阵S,并建立目标函数:

s.t.α(ν)≥0,αT1m=1,sij≥0,si1n=1,rank(Ls)=n-c.

上式中,S表示相似矩阵,A(v)表示邻接矩阵A的第v个视图,sij表示相似矩阵S的第i行第j个元素,α(v)为视图权重向量α的第v个元素,1m表示有m个元素的单位列向量,αT1m=1表示视图权重向量α的所有元素之和为1,1n表示n行1列的单位向量,si1n=1表示相似矩阵S的每一行之和等于1,Ls是相似矩阵S的拉普拉斯矩阵,rank(Ls)是拉普拉斯矩阵Ls的秩,c表示相似矩阵S中连通子图的个数,||·||1表示L1范数;

步骤3,对目标函数进行正则化,得到正则化后的目标函数:

s.t.α(ν)≥0,αT1m=1,sij≥0,si1n=1,rank(LS)=n-c.

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810325323.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top