[发明专利]一种结合卷积神经网络和梯度提升树的图像识别方法有效
申请号: | 201910375036.0 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110084318B | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 王沫楠;唐力 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 卷积 神经网络 梯度 提升 图像 识别 方法 | ||
1.一种结合卷积神经网络和梯度提升树的图像识别方法,其特征在于,包括如下步骤:
步骤1,生成输入图像的图像补丁:根据输入图像长和宽的中心值将输入图像均匀的分为4张图像作为输入图像的图像补丁;
步骤2,输入图像的样本扩充和数据预处理:对原始图像和生成的图像补丁进行样本扩充,对扩充后的图像数据进行预处理,将图像和对应标签组合,根据图像样本的数量分为一定大小的批次作为卷积神经网络模型的输入数据;
步骤3,训练卷积神经网络模型:采用五个分支,原图像和每一个补丁图像分别对应一个分支作为输入的数据,每个分支中采用改进后的VGG-19模型,所述的VGG-19模型是在2014年ILSVRC挑战赛上使用的模型,使用类感知损失函数对所述模型进行训练;所述改进后的VGG-19模型为:
使用迁移学习的方法利用已经训练好的VGG-19模型的结构、权重及偏值参数,将所述模型的倒数第二层压缩为一维向量,用2048个神经元组成的全连接层替换最后一层卷积层;
所述类感知损失函数的设计为:
使用图像特征之间的欧式距离作为两个图像相似性度量的方法,提出一种新的类感知损失函数,给损失函数加上类间相似性的罚值,所述类间相似性为:提取图像的特征与该图像所属类别的特征中心间欧氏距离与提取图像的特征与该图像不所属其他类别的所有图像的特征中心间欧式距离的差值;所述特征中心为:类别中已被正确分类的所有图像特征的平均值;所述罚值为一个(0,1)间的数值,罚值的最佳数值可以通过交叉验证的方法确定;当一个样本数据得到正确分类后,更新该类别的特征中心;
步骤4,图像特征提取:将经过图像样本扩充和数据预处理后的图像数据输入到训练好的VGG-19模型中,每张输入图像经过训练后模型的计算能够提取2048个该图像的特征;
步骤5,训练梯度提升树模型:采用五个梯度提升树模型,每一个梯度提升树模型对应一个改进后的VGG-19模型,所述模型提取的图像特征结合图像对应分类标签作为梯度提升树模型的输入数据对梯度提升树模型进行训练,从而得到五个基本分类器;
步骤6,组合为强分类器:五个基本分类器基于加权投票法进行线性组合,形成一个强分类器;
步骤7,图像识别:对于给定任意一副待识别图像,会形成相应的图像补丁与原图像一同作为输入数据分别输入到每个分支中,经过两个模型的计算,并利用所述加权投票法合并5个分支的结果获取最终图像分类的结果。
2.根据权利要求1所述的一种结合卷积神经网络和梯度提升树的图像识别方法,其特征在于:所述步骤1中通过获取图像补丁的方法为:
获取输入图像尺寸,根据图像的长和宽的中心值对图像进行划分,获取4张大小相等的图像作为输入图像的图像补丁。
3.根据权利要求1所述的一种结合卷积神经网络和梯度提升树的图像识别方法,其特征在于:所述步骤2中图像样本扩充的方法包括以下方法中的至少一种:
添加随机噪声:通过给原始图像数据添加随机噪声,将数据扩充2倍;
随机裁剪:根据输入图像的尺寸选择合适的裁剪尺寸,对原始图像进行随机裁剪,将数据扩充2倍;
图像翻转:对图像进行上下、左右、对角线翻转,将数据扩充3倍;
图像色彩调整:设定随机范围对图像的亮度和图像对比度进行调整,将数据扩充2倍;
图像色调饱和度调整:设定随机范围对图像的色调和图像饱和度进行调整,将数据扩充2倍。
4.根据权利要求1所述的一种结合卷积神经网络和梯度提升树的图像识别方法,其特征在于:所述步骤2中图像数据预处理方法为批标准化。
5.根据权利要求1所述的一种结合卷积神经网络和梯度提升树的图像识别方法,其特征在于:所述步骤3中改进VGG-19神经网络模型由输入层、隐藏层、输出层组成:
所述输入层为,输入图像数据通过步骤2提出的样本扩充以及图像数据预处理方法处理后作为该模型的输入;
所述隐藏层由多个卷积层和池化层组成,卷积层用来提取图像特征,采用不同通道数控制输出图像的数量,池化层对提取的特征进行下采样,采用2*2大小的卷积核和大小为2的步长控制输出图像特征的数量;
所述输出层为一个由2048个神经元组成的全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910375036.0/1.html,转载请声明来源钻瓜专利网。