[发明专利]一种基于深度学习的红外图像行人检测方法有效
申请号: | 202011181765.1 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112733589B | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 王智文;冯晶;王宇航 | 申请(专利权)人: | 广西科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/30;G06V10/82;G06N3/04 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 朱宝庆 |
地址: | 545006 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 红外 图像 行人 检测 方法 | ||
1.一种基于深度学习的红外图像行人检测方法,其特征在于:包括,
采集待检测的行人图像并进行预处理;
所述预处理包括,图像特征分析、图像降噪和图像增强;
所述图像特征分析包括,目标与背景特征分析和噪声特征分析;
所述图像降噪包括,高斯滤波、自适应中值滤波和小波自适应阈值去噪;
所述图像增强包括,红外图像的直方图、分段线性变换、Gamma校正、直方图均衡化和对比度受限的自适应直方图均衡化;
所述图像增强包括:
若所述图像为f(x,y),则定义图像灰度值为r0,r1,…,rk-1,则概率密度函数为P(ri),且有如下:
而分段线性变换是针对不同灰度级范围进行不同的线性变换,可以增强或降低某一灰度范围的对比度,对比度拉伸后显然比原图能够更加清晰地看到更多的细节,如下:
其中,x1、x2为需要转换的灰度范围,y1、y2为变换的斜率,对灰度区间[0,255]进行了分段线性变换,灰度区间[0,x1]和[x2,255]受到了压缩,减弱了噪声干扰;
图像的Gamma校正实质上是对图像矩阵中的每一个值进行幂运算,定义如下:
s=crγ
其中,γ的取值范围为0-1,因此需要先进行归一化,然后取指数;
直方图均衡化在图像像素映射过程中保证原来的大小关系保持不变,映射过程如下:
其中,n为图像像素的总和,L为灰度级总数;
将预处理后的所述图像输入搭建好的数据库内存储;
所述数据库由OTCBVS基准数据库构建,其包括OUS热行人数据集、CVC-09、CVC-14;
所述CVC-09包括FIR序列行人数据集,所述数据集由两组图像组成,分别为昼夜集,第一组包含5990帧,第二组包含5081帧,分别按训练集和测试集划分每个序列;
所述CVC-14包括可见FIR日夜行人序列数据集,所述数据集由两组图像组成,分别为昼夜集,而Visible和FIR取决于用户对序列进行记录的摄像机,白天训练3695张图像、晚上训练3390张图像,每个所述序列带有1500个强制行人注释;
基于深度卷积神经网络构建检测模型;
构建所述检测模型包括:
基于所述深度卷积神经网络策略提取所述预处理图像的候选区域的特征向量;
通过区域映射的方式将所述候选区域在最后的特征图的特征用感兴趣区域池化层得到特定的所述特征向量;
利用Softmax层分类所述候选区域的所述特征向量;
对所述候选区域的线性回归算法统一到网络中,结合所述Softmax并列成为一个多任务网络;
将所述多任务网络共享卷积特征并一起相互促进训练,训练结束,得到所述检测模型;
利用所述检测模型读取所述数据库内的所述图像,计算输出检测结果。
2.根据权利要求1所述的基于深度学习的红外图像行人检测方法,其特征在于,所述深度卷积神经网络包括:输入层、卷积层、池化层、全连接层以及输出层。
3.根据权利要求1所述的基于深度学习的红外图像行人检测方法,其特征在于:训练所述检测模型需对网络权值采取初值化操作,使得网络学习到输入、输出的形成映射关系,即训练包括两个阶段,前向传播阶段和反向传播阶段;
所述前向传播阶段包括:
将所述数据集中的样本输入至所述网络中,在经过各层神经元变换组合而获得输出结果,网络上层输出则为当前层输入,定义所述当前层输入为A[l-1],输出为A[l],如下:
Z[l]=W[l]A[l-1]+b
A[l]=g[l](Z[l])
其中,l表示神经网络的层数,W表示权重,b为偏置,g表示激活函数,Z表示该层所有z的向量化,A表示该层所有A的向量化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西科技大学,未经广西科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011181765.1/1.html,转载请声明来源钻瓜专利网。