[发明专利]一种基于深度学习的红外图像行人检测方法有效
申请号: | 202011181765.1 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112733589B | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 王智文;冯晶;王宇航 | 申请(专利权)人: | 广西科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/30;G06V10/82;G06N3/04 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 朱宝庆 |
地址: | 545006 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 红外 图像 行人 检测 方法 | ||
本发明公开了一种基于深度学习的红外图像行人检测方法,包括,采集待检测的行人图像并进行预处理;将预处理后的所述图像输入搭建好的数据库内存储;基于深度卷积神经网络构建检测模型;利用所述检测模型读取所述数据库内的所述图像,计算输出检测结果。本发明通过对红外图像进行特征分析、去噪和增强,使得图像细节信息凸显出来,把无用的信息都弱化掉,增加了行人检测的鲁棒性和精准度,同时,本发明还通过深度学习对网络权重进行训练寻找最优特征值,进一步提高了行人检测的适用性、可行性、准确性和批量处理效率性。
技术领域
本发明涉及图像处理、行人检测的技术领域,尤其涉及一种基于深度学习的红外图像行人检测方法。
背景技术
近几年来,随着深度学习技术的迅猛发展,基于深度学习的目标检测方法渐渐成熟起来,成为解决当前许多模式识别问题(包括物体检测)的主流方法,其与传统的目标检测方法相比,不需要通过专家来设定一个特定的特征,大量的样本通过深度学习算法模型,自动地提取特征,然后用提取到的特征训练分类器。虽然说目前将深度学习算法用于红外行人检测上的成果还不太多,但从发展趋势来看,深度学习将成为红外行人检测算法乃至很多目标检测领域的主流。
当前红外行人图像检测存在的难点和问题可以概括为5个方面,一、红外图像为灰度图像,没有色彩信息,而且图像深度有限,信噪比低,动态范围窄,这样对红外图像中的人体目标进行检测时,就不能像可见光那样通过对皮肤的颜色聚类;二、红外图像层次感差,纹理信息很少,而且边缘模糊,使得红外图像中的人体检测不能像可见光图像那样通过人的一些特征如眼睛、面部特点等对人体进行定位;三、由于红外图像是热成像,图像中存在很多干扰目标,如灯柱、动物、车辆、电器盒、建筑等热源,它们的红外成像比较容易与人体目标混淆;四、红外图像中目标的亮度还与目标表面特征、朝向、辐射波长有关,行人前进方向、服装成分厚重程度等都会对目标亮度产生影响,这些成像特征的不一致性,使得红外图像中人体目标的检测更加困难;五、行人兼具刚性和柔性的物特性,外表易受姿态、视角、遮挡等影响。因此研究红外图像中的人体检测具有重要的学术意义。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于深度学习的红外图像行人检测方法,能够解决红外图像特征分析目标对比度低、图像信噪比低而无法得到精确检测的问题。
为解决上述技术问题,本发明提供如下技术方案:包括,采集待检测的行人图像并进行预处理;将预处理后的所述图像输入搭建好的数据库内存储;基于深度卷积神经网络构建检测模型;利用所述检测模型读取所述数据库内的所述图像,计算输出检测结果。
作为本发明所述的基于深度学习的红外图像行人检测方法的一种优选方案,其中:所述预处理包括,图像特征分析、图像降噪和图像增强;所述图像特征分析包括,目标与背景特征分析和噪声特征分析;所述图像降噪包括,高斯滤波、自适应中值滤波和小波自适应阈值去噪;所述图像增强包括,红外图像的直方图、分段线性变换、Gamma校正、直方图均衡化和对比度受限的自适应直方图均衡化。
作为本发明所述的基于深度学习的红外图像行人检测方法的一种优选方案,其中:所述数据库由OTCBVS基准数据库构建,其包括OUS热行人数据集、CVC-09、CVC-14;所述CVC-09包括FIR序列行人数据集,所述数据集由两组图像组成,分别为昼夜集,第一组包含5990帧,第二组包含5081帧,分别按训练集和测试集划分每个序列;所述CVC-14包括可见FIR日夜行人序列数据集,所述数据集由两组图像组成,分别为昼夜集,而Visible和FIR取决于用户对序列进行记录的摄像机,白天训练3695张图像、晚上训练3390张图像,每个所述序列带有1500个强制行人注释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西科技大学,未经广西科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011181765.1/2.html,转载请声明来源钻瓜专利网。