[发明专利]一种鲁棒自动加权多特征聚类方法在审

申请号：	201810325323.6	申请日：	2018-04-12
公开（公告）号：	CN108764276A	公开（公告）日：	2018-11-06
发明（设计）人：	肖云;王长青;任鹏真;雷文龙;高颢函;许鹏飞;郭军;王欣;陈晓江;房鼎益	申请（专利权）人：	西北大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	西安恒泰知识产权代理事务所 61216	代理人：	张明
地址：	710069 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	鲁棒视图聚类特征聚类相似矩阵加权后处理处理数据合成数据实际数据权重标签测量学习引入
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出了一种鲁棒自动加权多特征聚类方法，用于处理数据集中异常值的多视图聚类问题。在提出的方法中，采用鲁棒L1标准来测量最终学习相似矩阵的距离和不同视图的相似矩阵之间的距离，通过引入超参数来学习权重，使用最好的超参数，该方法直接获得每个数据点的簇标签，而无需任何后处理，如K‑means；通过对两个合成数据集的评价表明了该方法的有效性。与基于四种实际数据集的多视图聚类方法相比，本方法的性能优于其他所有的比较方法。

技术领域

本发明属于计算机图像处理技术领域，具体是合计一种鲁棒自动加权多特征聚类方法，用于处理多视图聚类问题。

背景技术

随着互联网和大数据时代的到来，在机器学习中广泛存在着关于多视图数据的聚类任务。如何依据最初输入的多视图数据对原始的数据进行聚类是以至关重要的。例如，对于一个图片的聚类，我们可以从颜色、尺寸、纹理等多个角度对图片的特征进行描述。

通过将多视图数据集X转化为无向图当中的节点，依据每对数据点之间的相似度为节点之间的边赋相应的权重，从而实现多视图数据集向图的转化，每个图都代表研究对象一个视图，通过将多个视图进行相应的整合，来完成最终的聚类任务，生成标记矩阵。

在多视图学习中，如果存在质量较差的视图，则会严重影响聚类结果；而对于视图中存在的噪声或异常值，现有聚类方法对抗干扰能力比较差。因此，如何设计一个健壮的方法是多视图聚类任务的关键。

发明内容

传统的基于图的半监督学习方法普遍存在对于噪声过于敏感的现象，一些相对较小的噪声会对最终的聚类结果产生很坏的影响。为解决现有技术存在的问题，本发明提供一种鲁棒自动加权多特征聚类方法。

本发明的技术方案如下：

步骤1，构建原始多视图数据集X＝{X⁽¹⁾,X⁽²⁾,...,X^(m)}的邻接矩阵集A＝{A⁽¹⁾,A⁽²⁾,...,A^(m)}，其中A^(v)表示X^(v)对应的邻接矩阵，邻接矩阵A中的元素表示第v个视图X^(v)中的第i个数据节点x_i与第j个数据节点x_j的之间的相似度，v＝1,2,…,m，m表示视图个数；

步骤2，引入相似矩阵S，并建立目标函数：

s.t.α^(ν)≥0,α^T1m＝1,s_ij≥0,s_i1n＝1,rank(L_s)＝n-c.

上式中，S表示相似矩阵，A^(v)表示邻接矩阵A的第v个视图，s_ij表示相似矩阵S的第i行第j个元素，α^(v)为视图权重向量α的第v个元素，1m表示有m个元素的单位列向量，α^T1m＝1表示视图权重向量α的所有元素之和为1，1n表示n行1列的单位向量，s_i1n＝1表示相似矩阵S的每一行之和等于1，L_s是相似矩阵S的拉普拉斯矩阵，rank(L_s)是拉普拉斯矩阵L_s的秩，c表示相似矩阵S中连通子图的个数，||·||₁表示L1范数；

步骤3，对目标函数进行正则化，得到正则化后的目标函数：

s.t.α^(ν)≥0,α^T1m＝1,s_ij≥0,s_i1n＝1,rank(L_S)＝n-c.

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北大学，未经西北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810325323.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种鲁棒自动加权多特征聚类方法在审

专利文献下载