[发明专利]基于深度卷积神经网络的典型红外目标分类方法在审
申请号: | 201910779094.X | 申请日: | 2019-08-22 |
公开(公告)号: | CN110619352A | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 刘伟峰;张倩文;王亚宁 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 33240 杭州君度专利代理事务所(特殊普通合伙) | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 红外目标图像 样本 预处理 传统神经网络 红外图像识别 卷积神经网络 神经网络模型 归一化函数 车辆模型 分类效果 红外目标 红外图像 实时计算 特征提取 特征信息 不重叠 测试集 训练集 遮挡物 中性能 分类 减小 浅层 | ||
1.基于深度卷积神经网络的典型红外目标分类方法,其特征在于该方法具体如下:
步骤(1).数据集的获取及预处理:
通过红外热像仪采集得到目标的红外图像,所述的红外图像包括不同距离和角度以及有无遮挡物情况下红外传感器获取的目标不同红外图像样本;
将获取的红外图像样本归为数据集X,X={(xi,yi)/i∈Λ};其中,xi表示第i个红外图像样本输入,yi表示xi对应的真实标记,yi∈(1,2,…,C),C为红外目标图像的类别数,Λ是样本的索引集合;
将数据集X分为不重叠的训练集和测试集,其中训练集占数据集X的85~95﹪,其他为测试集;将数据集X图像尺寸裁剪为VGG16深度神经网络模型的输入图像尺寸(224×224),并进行数据在线增强操作;
步骤(2).建立深度卷积神经网络模型获取红外目标图像特征,选用的深度卷积神经网络模型为含13层卷积层的VGG16深度神经网络模型,具体为:
步骤(2.1)卷积操作;
将训练集红外图像样本输入VGG16深度神经网络模型,H、W、D分别表示高度、宽度、通道数,表示属于实数域;xl为红外图像样本输入xi进入卷积层l的张量,卷积核
卷积操作:其中,(il+1,jl+1)表示红外图像样本输入xi经过卷积运算之后的像素所在位置的坐标,dl表示通道数,d表示卷积核个数,为学习的权重;
步骤(2.2)池化运算:
pl为第l层池化核,最大值池化操作公式如下:
步骤(2.3)非线性变换:
激活函数采用ReLu函数,定义为:
当时,ReLu硬饱和;
当时,则不存在不饱和问题;
步骤(3).红外目标图像分类;
所述VGG16深度神经网络模型有2个全连接特征层以及1个全连接分类层;通过训练学习得到的红外目标图像特征,每个像素与三层全连接层的神经元进行连接,分别得到1×1×4096、1×1×4096和1×1×c的输出,记VGG16深度神经网络模型的最终输出为hi(c),即样本i的预测结果;
通过softmax函数得到网络预测概率pi(c):m为总类别C中的一类;
根据样本的预测结果和真实结果产生的误差,目标函数通过反向传播方法进行深度神经网络参数学习,采用交叉熵损失函数L(θ)解析该分类问题:
其中,为softmax分类器的模型参数,损失函数L(θ)对于最终输出hi(c)的导数为:
根据预测结果和真实标记之间产生的误差,不断向前层传递即反向传播,VGG16深度神经网络模型的权重参数将不断更新,从而完成VGG16深度神经网络模型训练,最后根据网络预测概率pi(c)实现对红外目标图像的结果分类。
2.如权利要求1所述的基于深度卷积神经网络的典型红外目标分类方法,其特征在于:所述的VGG16深度神经网络模型每层卷积核个数分别为2、2、3、3、3,卷积核尺寸为(3.3),延拓的尺寸与步长为(1,1);所述的VGG16深度神经网络模型结构在训练过程中选择批大小为16,随机失活比例为0.5,迭代次数为40000,起始学习速率为0.001,每隔10000次降低为原来的0.1倍,共训练2000次;动量常数和权重正则系数分别为0.9和0.000005。
3.如权利要求1所述的基于深度卷积神经网络的典型红外目标分类方法,其特征在于:池化运算中池化层的池化窗口尺寸和步长都为(2.2),所有池化层均采用最大值池化的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910779094.X/1.html,转载请声明来源钻瓜专利网。