[发明专利]基于流形学习和梯度提升模型的图片偏多标签分类方法有效
申请号: | 202010023677.2 | 申请日: | 2020-01-09 |
公开(公告)号: | CN111259938B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 陈刚;强宇周;王皓波;谌晨;陈珂;胡天磊;寿黎但;伍赛 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 流形 学习 梯度 提升 模型 图片 标签 分类 方法 | ||
本发明公开了一种基于流形学习和梯度提升模型的图片偏多标签分类方法。从训练数据集构建一个加权图,通过求解以上第一最小化模型获得非负权重矩阵,根据加权图建立第二最小化模型并求解获得重构标签矩阵,根据重构标签矩阵将训练数据集换构造并训练二值相关模型,预测得标签矩阵;对图片的特征向量矩阵建立回归器最小化求解,用迭代预测结果矩阵增强特征向量矩阵,结合负梯度矩阵构造数据集并训练学习获得弱回归器,求和所有弱回归器,得最终回归器,对预待测图片处理判断。本发明能够充分地利用图片偏多标签数据之间的相关性来提升图片的多标签分类预测性能,可实现偏标签数据的消歧,提高了准确度和鲁棒性,其性能优于现有的图片偏多标签方法。
技术领域
本发明涉及标签分类中的偏多标签问题,尤其是涉及了一种基于流形学习和梯度提升的两阶段偏多标签学习方法。
背景技术
在图片多标签分类问题中,一个图片能够同时关联多个标签。传统图片多标签分类问题中的一个常见假设是训练数据集中的每个图片都被精确标记,即是有监督的。不幸的是,在许多真实的图片多标签分类问题中,无噪声的标签是很难获得的。相比之下,获取一组候选标签是非常容易的。这类问题被定义为图片的偏多标签学习问题(PartialMulti-Label Learning,PML)。
PML的基本假设是图片的正确标签被隐藏在了候选标签集中,并且它对学习器是不可见的。最具直觉性的PML方法是将所有候选标签视为有效标签。然后,PML问题可以通过任何现成的多标签学习算法来解决,例如:二值相关算法(Binary Relevance,BR),分类器链,CPLST等等。但是,这样的策略忽略了候选标签集中的噪声标签,这可能导致标签相关性提取不充分,反过来又影响了预测性能。
为了解决这个问题,研究者提出了一些PML方法。其中一些方法注重消歧性质,通过为每个候选标签分配置信度值来估计它是正确标签的可能性,例如PML-lc和PML-fp,其中置信度得分是通过最小化置信度加权排名损失来计算的。但是,当假阳性标签的比例很高时,由于其选择性优化策略,算法容易出错。PARTICLE方法利用特征空间中的最近邻居,通过迭代式的标签传播技术来识别具有高标签置信度的可信标签。接下来,它应用点对标签排序技术来学习得到多标签预测器。但是,它只能够提取二阶标签相关性,因此在复杂数据集性能较差。fPML是另一种流行的PML方法,专注于探索标签相关性。fPML遵循经典的标签投影方法模式,只能处理标签空间高度稀疏的数据集。现有的PML方法都专注于候选标签集消歧或标签相关性提取中的其中一个方面,因此这些方法的预测性能有限。
发明内容
针对现有技术的不足,本发明的目的在于一种提供基于流形学习和梯度提升算法的偏多标签算法,针对图片处理,解决了图片中多个实物物体的同时分类识别问题。
本发明所采用的技术方案如下:
第一阶段,首先进行标签消歧,包括步骤1和步骤2:
步骤1:
首先从预先给定的训练数据集中构建一个加权图其中,V代表图片特征向量的集合,V={xi|1≤i≤n},xi表示第i个图片的特征向量,i表示图片的序数,n表示训练数据集中图片的总数;E代表每两个图片之间的连接关系的集合,E={(xi,xj)|i≠j,xj∈kNN(xi)},kNN(xi)表示到第i个图片的特征向量xi距离最近的前k个图片的特征向量的集合,(xi,xj)表示第j个图片和第i个图片具有连接关系;W为非负权重矩阵,W=[wij]n×n,其中wij表示第j个图片对第i个图片的权重;
本发明所述的距离为欧式距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010023677.2/2.html,转载请声明来源钻瓜专利网。