[发明专利]基于深度学习的细粒度图像识别方法和装置在审
申请号: | 201911193231.8 | 申请日: | 2019-11-28 |
公开(公告)号: | CN111027605A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 宋波 | 申请(专利权)人: | 北京影谱科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 孙黎生 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 细粒度 图像 识别 方法 装置 | ||
1.一种基于深度学习的细粒度图像识别方法,通过深度卷积神经网络对ImageNet数据库上的预训练模型进行加载和训练,训练过程中先对深度卷积神经网络的全连接层进行训练,将全连接层的参数进行优化后再训练所述深度卷积网络的其余层,从而得到优化后的细粒度图像识别模型,最后通过YOLO目标检测将待检的目标图像输入到深度卷积神经网络中,生成该目标图像所对应的检测框,由所述细粒度图像识别模型的置信度对所得到的检测框进行阈值处理,并输出图像识别结果。
2.根据权利要求1所述的基于深度学习的细粒度图像识别方法,其特征在于,训练过程中先对深度卷积神经网络的全连接层进行训练时,是将预训练模型中的训练数据通过所述深度卷积神经网络计算后由全连接层输出数量与待生成的目标图像类别相同的识别结果。
3.根据权利要求2所述的基于深度学习的细粒度图像识别方法,其特征在于,将全连接层的参数进行优化后再训练所述深度卷积网络的其余层,是将全连接层的输出与目标图像的类别标签做交叉熵损失计算,以最小化该损失函数为目标,通过不断的迭代优化使得输出的目标图像类别与真实的图像类别标签接近,从而得到优化后的细粒度图像识别模型。
4.根据权利要求3所述的基于深度学习的细粒度图像识别方法,其特征在于,所述预训练模型为ImageNet数据库上训练的分类1000类的预训练模型,数据加载批次大小为64,训练过程中使用Momentum优化方法对深度卷积神经网络中的全连接层的参数进行优化,进行全连接层优化时的Momentum参数为0.5,迭代次数为100。
5.根据权利要求3或4所述的基于深度学习的细粒度图像识别方法,其特征在于,在进行训练所述深度卷积网络的其余层,实现全网络训练的训练过程中使用梯度下降优化方法,学习率为0.0001,迭代次数为1000。
6.根据权利要求1所述的基于深度学习的细粒度图像识别方法,其特征在于,通过YOLO目标检测将待检的目标图像输入到深度卷积神经网络中,生成该目标图像所对应的检测框,由所述细粒度图像识别模型的置信度对所得到的检测框进行阈值处理,并输出图像识别结果,包括:
将待检的目标图像的大小调整为标准大小,然后输入深度卷积神经网络;
运行深度卷积神经网络,得到目标图像所对应检测框的边界框坐标、边界框中包含物体的置信度和类别概率;
由所述细粒度图像识别模型的置信度对所得到的检测框进行阈值处理,得到最终的图像识别结果。
7.一种基于深度学习的细粒度图像识别装置,包括:
初次训练模块,其配置成通过深度卷积神经网络对ImageNet数据库上的预训练模型进行加载和训练,训练过程中先对深度卷积神经网络的全连接层进行训练;
二次训练模块,其配置成将全连接层的参数进行优化后再训练所述深度卷积网络的其余层,从而得到优化后的细粒度图像识别模型;
目标识别模块,其配置成通过YOLO目标检测将待检的目标图像输入到深度卷积神经网络中,生成该目标图像所对应的检测框,由所述细粒度图像识别模型的置信度对所得到的检测框进行阈值处理,并输出图像识别结果。
8.根据权利要求7所述的基于深度学习的细粒度图像识别装置,其特征在于,所述初次训练模块中,其配置成训练过程中先对深度卷积神经网络的全连接层进行训练时,是将预训练模型中的训练数据通过所述深度卷积神经网络计算后由全连接层输出数量与待生成的目标图像类别相同的识别结果。
9.根据权利要求8所述的基于深度学习的细粒度图像识别装置,其特征在于,所述二次训练模块中,其配置成将全连接层的参数进行优化后再训练所述深度卷积网络的其余层,是将全连接层的输出与目标图像的类别标签做交叉熵损失计算,以最小化该损失函数为目标,通过不断的迭代优化使得输出的目标图像类别与真实的图像类别标签接近,从而得到优化后的细粒度图像识别模型。
10.根据权利要求7所述的基于深度学习的细粒度图像识别装置,其特征在于,所述目标识别模块,其所实现的目标识别步骤具体配置成包括:
将待检的目标图像的大小调整为标准大小,然后输入深度卷积神经网络;
运行深度卷积神经网络,得到目标图像所对应检测框的边界框坐标、边界框中包含物体的置信度和类别概率;
由所述细粒度图像识别模型的置信度对所得到的检测框进行阈值处理,得到最终的图像识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京影谱科技股份有限公司,未经北京影谱科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911193231.8/1.html,转载请声明来源钻瓜专利网。