[发明专利]一种基于深度学习的红外图像行人检测方法及检测系统在审
| 申请号: | 201910716970.4 | 申请日: | 2019-08-05 |
| 公开(公告)号: | CN110472542A | 公开(公告)日: | 2019-11-19 |
| 发明(设计)人: | 孙立坤;林保均;王忠荣;焦玉海;吕建峰;时文忠 | 申请(专利权)人: | 深圳北斗通信科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08;G06N3/04 |
| 代理公司: | 44248 深圳市科吉华烽知识产权事务所(普通合伙) | 代理人: | 赵雪佳<国际申请>=<国际公布>=<进入 |
| 地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 红外图像 行人检测 卷积神经网络 检测系统 目标检测 构建 计算机视觉技术 实时性要求 数据预处理 获取数据 最优模型 鲁棒性 网络 预测 学习 | ||
本发明提供一种基于深度学习的红外图像行人检测方法及检测系统,属于计算机视觉技术领域。本发明红外图像行人检测方法包括如下步骤:获取数据和数据预处理;基于卷积神经网络构建目标检测FIDN网络;基于卷积神经网络构建目标检测FIDN网络;基于最优模型预测,本发明还提供一种实现所述红外图像行人检测方法的检测系统。本发明的有益效果为:确保高精度的同时能满足实时性要求,鲁棒性强。
技术领域
本发明涉及一种图像检测方法,尤其涉及一种基于深度学习的红外图像行人检测方法及检测系统。
背景技术
目标检测是计算机视觉领域中一个重要的课题,主要任务是从图像中定位感兴趣的目标,需要准确地判断每个目标的具体类别,并给出每个目标的边界框。由于视角、遮挡、姿态等因素引起目标发生形变,导致目标检测成为一个具有挑战性的任务。
传统目标检测方法主要分为预处理、窗口滑动、特征提取、特征选择、特征分类和后处理六个步骤。传统目标检测一般是通过设计一些较好的人工特征,然后使用分类器进行分类。随着目标检测精度和速度要求越来越高,传统方法已经不能满足需求了。近年来,深度学习技术得到了广泛的应用,产生了一系列目标检测算法,例如RCNN、Fast-RCNN、Faster-RCNN,YOLO,SSD及其一系列衍生算法,但是这些检测技术或由于精度低或检测耗时过长并不能很好的应用到商业产品中。目前的目标检测算法很难满足实际应用的需求,在科研领域,大部分研究者只关注目标检测精度(使用mAP(Mean Average Precision,平均精度均值)度量),会设计出很复杂的网络加一些很复杂的方法和一些训练技巧,然后在公开数据集上得到一个较好的成绩,但是这很难直接应用到实际中去。红外成像是依靠红外传感器的热成像性能来获取图像的,只取决于物体的温度和其所辐射的热量。因此在夜晚、雨天或雾霾等光线强度不足的情况下,红外图像相较于可见光图像有明显的优势。人体目标作为环境中最主要、最活跃的因素,一直以来都是目标跟踪和检测领域的研究热点,而人体目标的非刚性,加之红外图像自身的缺点,使得基于红外图像的行人检测充满了困难与挑战。
发明内容
为解决现有技术中的问题,本发明提供一种基于深度学习的红外图像行人检测方法及检测系统,确保高精度的同时能满足实时性要求。
本发明基于深度学习的红外图像行人检测方法包括如下步骤:
步骤S1:获取数据和数据预处理:获取包含行人的红外图像,对红外图像进行预处理,并对预处理后的红外图像进行人工标注,然后按照设定比例划分为检测模型的训练集和验证集;
步骤S2:基于卷积神经网络构建目标检测FIDN网络:所述目标检测FIDN网络包括若干层卷积层和最大池化层,及设置在卷积层和最大池化层后面的扩张卷积层,卷积层的堆叠中,当通道数达到设定值时,扩张卷积层的通道数不再增加;
步骤S3:模型训练:使用训练集对目标检测FIDN网络进行模型训练,并选出在验证集表现最优的最优模型;
步骤S4:最优模型预测:基于最优模型,在GPU服务器上进行预测,实现对视频流进行目标检测。
本发明作进一步改进,步骤S2中,所述目标检测FIDN网络还包括自适应特征图通道加权模块,设置在扩张卷积层输出端,用于对扩张卷积层输出的特征图的通道加权。
本发明作进一步改进,所述自适应特征图通道加权模块的处理方法为:
A1:使用一个全局池化层把特征图压缩为1*1*C,其中,C表示特征图的通道数;
A2:使用全连接层把通道数压缩为C/16;
A3:通过Relu激活函数,使用全连接层把通道数还原为C;
A4:输出结果接sigmoid激活层,得到一个1*1*C的权重向量,经过sigmoid函数处理,所述权重向量内的权重取值在0-1之间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳北斗通信科技有限公司,未经深圳北斗通信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910716970.4/2.html,转载请声明来源钻瓜专利网。





