[发明专利]一种基于加权列抽样XGBoost的图像目标分类方法有效

专利信息
申请号: 201710580163.5 申请日: 2017-07-17
公开(公告)号: CN107392241B 公开(公告)日: 2020-12-25
发明(设计)人: 高欣;范少华;李新鹏;张浩;戚岳;曹良晶;贾庆轩;彭岳星;刁新平 申请(专利权)人: 北京邮电大学;国网冀北电力有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 加权 抽样 xgboost 图像 目标 分类 方法
【说明书】:

发明实施例提出了一种基于加权列抽样XGBoost的图像目标分类方法,包括:利用在大型数据集ILSVRC预训练过的并且在PASCAL VOC 2012数据集上进行过微调的卷积神经网络提取目标图像特征;连接多层学习到的特征以获得更多决定其图像类别的内容信息;利用基于加权列抽样的XGBoost方法对图像特征分类,根据属性重要度,在构建决策树之前对属性进行次采样,将抽取的具有更多信息的属性用于当前决策树的构建,重复迭代直到收敛,得到性能最佳的图像分类模型。根据本发明实施例提供的技术方案,当数据的属性维度大且冗余度高时,该方法可以扩展到其他使用列抽样的分类方法,提高图像目标分类的平均准确率。

技术领域

本发明涉及图像目标分类方法,尤其涉及一种基于加权列抽样XGBoost的图像目标分类方法。

背景技术

在图像目标分类任务中,一个图像根据图像中视觉内容分类。例如,这张图片中是否存在汽车?一个重要的应用就是图片检索——在图片数据集中检索具有特定内容的图片。但伴随着图片成为互联网中的主要信息载体,难题随之出现,当信息由文字记载时,我们可以通过关键词搜索轻易找到所需内容并进行任意编辑,而当信息是由图片记载时,提高其检索准确率是当今研究的一个热点问题。图片给我们带来了快捷的信息记录和分享方式,却降低了我们的信息检索效率,在这个环境下,计算机的图像识别技术就显得尤为重要。图像特征提取在识别图像类别时起到了关键作用,传统的基于手工提取的方法要针对特定问题做调整,而且需要大量的专业知识和时间。近年来,基于深度卷积神经网络提取图像特征被证明十分有效,然而,提取之后的图像特征具有较大的维度和冗余度,目前的分类器对于此类数据性能较差,影响到对于图像目标类别的识别。

发明内容

有鉴于此,本发明实施例提出了一种基于加权列抽样XGBoost的图像目标分类方法,以提高模型对于具有高冗余度信息的图像特征的分类准确率。

本发明实施例提出一种基于加权列抽样XGBoost的图像目标分类方法,包括:

利用在大型数据集ILSVRC预训练过的并且在PASCAL VOC 2012数据集上进行过微调的卷积神经网络提取目标图像的特征;

连接多层学习到的特征以获得更多决定其图像类别的内容信息;

利用基于加权列抽样的XGBoost方法对图像特征分类,根据属性重要度,在构建决策树之前对属性进行次采样,将抽取到的具有更多信息的属性用于当前决策树的构建,重复迭代直到收敛,得到性能最佳的图像分类模型,具体为:根据属性对于目标类别的区分能力计算每个属性的重要度;属性重要度正比于属性在列抽样时此属性被抽到的概率大小,在构建每棵决策树之前,对图像特征进行基于属性重要度的不等概不放回采样,将抽取到的具有更多信息的属性用于当前决策树的构建,重复迭代直到收敛,即可得到性能最佳的图像分类模型;

利用所述基于属性重要度的加权列抽样的XGBoost方法步骤如下:

1)基于属性对于目标的区分程度计算其每列特征的属性重要度;

属性重要度f(k)由下式确定:

其中,表示属性k的所有样本的类内方差,由下式确定:

其中,表示第i类样本第k维的平均值;Di为属于类别i的样本;Ni为类别i的样本个数;x为样本数据;x(k)为样本数据第k维的值;为类别i在第k维的类内方差;m为可能的类别数量;

其中,表示属性k的类间差异,由下式确定:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学;国网冀北电力有限公司,未经北京邮电大学;国网冀北电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710580163.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top