[发明专利]基于深度子空间自表达的多标签分类方法有效
申请号: | 202010614744.8 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111860614B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 杨博 | 申请(专利权)人: | 西安工程大学 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/2431;G06F18/10;G06N3/0455;G06N3/082 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 弓长 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 空间 表达 标签 分类 方法 | ||
本发明公开了一种基于深度子空间自表达的多标签分类方法,具体为:首先利用深度子空间神经网络结构表示数据间的相似程度,接着利用数据相似性与训练数据的标签集合构建数据的实数值标签预测值,最后利用深度分类网络实现多标签数据的分类。本发明的基于深度子空间自表达的多标签分类方法,利用数据间的相似程度构建数据的实数值标签,再利用深度神经网络可自动对无标注的多标签数据进行标注,提高了多标签数据分类的精度与效果。
技术领域
本发明属于数据挖掘与模式识别技术领域,涉及一种基于深度子空间自表达的多标签分类方法。
背景技术
随着互联网与存储技术的不断提高,数据的收集与呈现形式更加便捷与丰富。传统的二值分类,即将数据与互不相交的标签集合中的一个标签元素相对应的分类方式无法有效表达现实中的许多问题。例如例如一位患者可能患有多种疾病,一篇新闻报道可能涉及多个领域,一位用户可能购买多种商品等。这种同时具有多重语义的分类问题为多标签分类问题。多标签分类已成功应用于多媒体内容的自动标注、关联规则挖掘、信息检索、标签推荐、推荐系统等领域。
多标签分类概念自提出以来,一直是国内外的研究热点。Wright等人提出基于稀疏表示的分类(Classification Based on Sparse Representation,SRC)算法(文献1:Wright J,Yang AY,Ganesh A,et al.Robust face recognition via sparserepresentation[J].IEEE Transactions on Pattern AnalysisMachine Intelligence,2008,31(2):210-227.),将稀疏表示理论应用到分类中。由于超完备字典能用尽可能稀疏的方式表示数据,并且冗余系统对噪声与误差的容忍更为稳健,因而算法取得较为显著的效果。由于基于稀疏表示的分类算法取得较为显著的效果,学者们将其改编为一系列基于稀疏表示的多标签分类算法。这一系列的算法通过计算测试样本与所有训练样本之间的重构关系,获得每一个训练样本对应的系数,这些系数构成对测试数据的表示。这样的处理过程,可充分考虑测试样本的全局信息,但并没有考虑样本的局部信息。此外,这一类方法未能考虑标签之间的关联。
张敏灵等人将K近邻与最大后验概率原理结合,提出基于K近邻的多标签分类算法(Multi-label K Nearest Neighbor,ML-KNN)(文献2:Zhang M L,Zhou Z H.ML-KNN:Alazylearning approach to multi-label learning[J].Pattern Recognition,2007,40(7):2038-2048.)。后续又涌现一系列针对该算法没有考虑标签相关性、类别不一致、类别不平衡等问题提出的改进算法和将KNN与其它算法或理论相结合的算法。虽然基于局部的多标签分类系列算法在实际应用中取得较好的分类效果,但存在着只考虑测试数据的局部信息,未能考虑测试数据的全局信息、对噪声和K值比较敏感、未能利用标签间的高阶关联等缺点。
发明内容
本发明的目的是提供一种基于深度子空间自表达的多标签分类方法,利用数据间的相似程度构建数据的实数值标签,再利用深度神经网络可自动对无标注的多标签数据进行标注,提高了多标签数据分类的精度与效果。
本发明所采用的技术方案是,基于深度子空间自表达的多标签分类方法,具体按照如下步骤实施:
步骤1,预训练自动编码器神经网络
读取多标签数据并进行预处理,使用深度自动编码器神经网络,以数据重构为目标,以经预处理的多标签数据作为输入数据,对输入数据进行训练获得网络参数的初始值;
步骤2,训练深度子空间自表达神经网络
构建深度子空间自表达神经网络,以步骤1预训练的结果权值作为初始值赋值于深度子空间自表达神经网络,以数据重构误差、线性层的权值稀疏度以及稀疏表示的重构误差最小化为目标进行训练,训练深度子空间自表达神经网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安工程大学,未经西安工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010614744.8/2.html,转载请声明来源钻瓜专利网。