[发明专利]一种基于深度学习的红外图像行人检测方法及检测系统在审
| 申请号: | 201910716970.4 | 申请日: | 2019-08-05 |
| 公开(公告)号: | CN110472542A | 公开(公告)日: | 2019-11-19 |
| 发明(设计)人: | 孙立坤;林保均;王忠荣;焦玉海;吕建峰;时文忠 | 申请(专利权)人: | 深圳北斗通信科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08;G06N3/04 |
| 代理公司: | 44248 深圳市科吉华烽知识产权事务所(普通合伙) | 代理人: | 赵雪佳<国际申请>=<国际公布>=<进入 |
| 地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 红外图像 行人检测 卷积神经网络 检测系统 目标检测 构建 计算机视觉技术 实时性要求 数据预处理 获取数据 最优模型 鲁棒性 网络 预测 学习 | ||
1.一种基于深度学习的红外图像行人检测方法,其特征在于,所述红外图像行人检测方法包括如下步骤:
步骤S1:获取数据和数据预处理:获取包含行人的红外图像,对红外图像进行预处理,并对预处理后的红外图像进行人工标注,然后按照设定比例划分为检测模型的训练集和验证集;
步骤S2:基于卷积神经网络构建目标检测FIDN网络:所述目标检测FIDN网络包括若干层卷积层和最大池化层,及设置在卷积层和最大池化层后面的扩张卷积层,卷积层的堆叠中,当通道数达到设定值时,扩张卷积层的通道数不再增加;
步骤S3:模型训练:使用训练集对目标检测FIDN网络进行模型训练,并选出在验证集表现最优的最优模型;
步骤S4:最优模型预测:基于最优模型,在GPU服务器上进行预测,实现对视频流进行目标检测。
2.根据权利要求1所述的红外图像行人检测方法,其特征在于:步骤S2中,所述目标检测FIDN网络还包括自适应特征图通道加权模块,设置在扩张卷积层输出端,用于对扩张卷积层输出的特征图的通道加权。
3.根据权利要求2所述的红外图像行人检测方法,其特征在于:所述自适应特征图通道加权模块的处理方法为:
A1:使用一个全局池化层把特征图压缩为1*1*C,其中,C表示特征图的通道数;
A2:使用全连接层把通道数压缩为C/16;
A3:通过Relu激活函数,使用全连接层把通道数还原为C;
A4:输出结果接sigmoid激活层,得到一个1*1*C的权重向量,经过sigmoid函数处理,所述权重向量内的权重取值在0-1之间;
A5:采用权重对特征图通道维度进行加权。
4.根据权利要求1-3任一项所述的红外图像行人检测方法,其特征在于:步骤S1中,所述预处理包括中值滤波处理,中值滤波公式如下:
g(x,y)=median{fx-k,y-l),(k,l)∈W}
其中,f(x,y)和g(x,y)分别为原始图像和处理后图像,W为二维模板。
5.根据权利要求4所述的红外图像行人检测方法,其特征在于:人工标注是使用标注工具将每一张图片中的行人都用矩形框框出,矩形框为目标行人的最小外接矩形,对应产生的XML文件,在XML文件中,记录图中每个目标的坐标,包含左上角坐标x,左上角坐标y,宽度w和高度h,同时删掉图片模糊或者难以标注的图片,将上述数据混合,按照9:1的比例划分为检测模型的训练集和验证集。
6.根据权利要求5所述的红外图像行人检测方法,其特征在于:步骤S2中,所述目标检测FIDN网络由7层1*1卷积或者3*3卷积网络构成的全卷积网络,图像上的候选框是在直接在原图像上产生,生成方法如下:
B1:直接把原图像分为S*S个区域,其中S为最后一个卷积的特征图的大小;
B2:在每个区域生成若干个长宽比不同的候选框,具体长宽比根据数据集标记的矩形框使用k-means算法得到;
B3:根据实际数据集计算先验候选框的尺寸分布,使用(1-IoU)作为距离度量,其中IoU表示先验候选框与标记的矩形框之间面积的交并比,计算公式如下:
其中,A表示先验候选框,B表示标记的矩形框,∩表示A与B的交集,∪表示A与B的并集。
7.根据权利要求6所述的红外图像行人检测方法,其特征在于:所述目标检测FIDN网络以轻量级卷积神经网络作为骨干网络,根据目标检测算法,使用一个1*1的卷积进行预测,所述目标检测算法的定位损失函数为:
其中,λ是一个控制定位损失在总的损失占比的系数,S表示最后卷积的特征图的大小,A表示每个区域生成锚框的个数,是一个0-1函数,如果第i行j列的区域有目标,取值为1,否则取值0,x,y,h,w分别表示中心点的坐标、预测框的高和宽,其中下标带^表示是真实值,没带^的表示预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳北斗通信科技有限公司,未经深圳北斗通信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910716970.4/1.html,转载请声明来源钻瓜专利网。





