[发明专利]一种基于深度学习的红外图像行人检测方法及检测系统在审

专利信息
申请号: 201910716970.4 申请日: 2019-08-05
公开(公告)号: CN110472542A 公开(公告)日: 2019-11-19
发明(设计)人: 孙立坤;林保均;王忠荣;焦玉海;吕建峰;时文忠 申请(专利权)人: 深圳北斗通信科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/08;G06N3/04
代理公司: 44248 深圳市科吉华烽知识产权事务所(普通合伙) 代理人: 赵雪佳<国际申请>=<国际公布>=<进入
地址: 518000 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 红外图像 行人检测 卷积神经网络 检测系统 目标检测 构建 计算机视觉技术 实时性要求 数据预处理 获取数据 最优模型 鲁棒性 网络 预测 学习
【权利要求书】:

1.一种基于深度学习的红外图像行人检测方法,其特征在于,所述红外图像行人检测方法包括如下步骤:

步骤S1:获取数据和数据预处理:获取包含行人的红外图像,对红外图像进行预处理,并对预处理后的红外图像进行人工标注,然后按照设定比例划分为检测模型的训练集和验证集;

步骤S2:基于卷积神经网络构建目标检测FIDN网络:所述目标检测FIDN网络包括若干层卷积层和最大池化层,及设置在卷积层和最大池化层后面的扩张卷积层,卷积层的堆叠中,当通道数达到设定值时,扩张卷积层的通道数不再增加;

步骤S3:模型训练:使用训练集对目标检测FIDN网络进行模型训练,并选出在验证集表现最优的最优模型;

步骤S4:最优模型预测:基于最优模型,在GPU服务器上进行预测,实现对视频流进行目标检测。

2.根据权利要求1所述的红外图像行人检测方法,其特征在于:步骤S2中,所述目标检测FIDN网络还包括自适应特征图通道加权模块,设置在扩张卷积层输出端,用于对扩张卷积层输出的特征图的通道加权。

3.根据权利要求2所述的红外图像行人检测方法,其特征在于:所述自适应特征图通道加权模块的处理方法为:

A1:使用一个全局池化层把特征图压缩为1*1*C,其中,C表示特征图的通道数;

A2:使用全连接层把通道数压缩为C/16;

A3:通过Relu激活函数,使用全连接层把通道数还原为C;

A4:输出结果接sigmoid激活层,得到一个1*1*C的权重向量,经过sigmoid函数处理,所述权重向量内的权重取值在0-1之间;

A5:采用权重对特征图通道维度进行加权。

4.根据权利要求1-3任一项所述的红外图像行人检测方法,其特征在于:步骤S1中,所述预处理包括中值滤波处理,中值滤波公式如下:

g(x,y)=median{fx-k,y-l),(k,l)∈W}

其中,f(x,y)和g(x,y)分别为原始图像和处理后图像,W为二维模板。

5.根据权利要求4所述的红外图像行人检测方法,其特征在于:人工标注是使用标注工具将每一张图片中的行人都用矩形框框出,矩形框为目标行人的最小外接矩形,对应产生的XML文件,在XML文件中,记录图中每个目标的坐标,包含左上角坐标x,左上角坐标y,宽度w和高度h,同时删掉图片模糊或者难以标注的图片,将上述数据混合,按照9:1的比例划分为检测模型的训练集和验证集。

6.根据权利要求5所述的红外图像行人检测方法,其特征在于:步骤S2中,所述目标检测FIDN网络由7层1*1卷积或者3*3卷积网络构成的全卷积网络,图像上的候选框是在直接在原图像上产生,生成方法如下:

B1:直接把原图像分为S*S个区域,其中S为最后一个卷积的特征图的大小;

B2:在每个区域生成若干个长宽比不同的候选框,具体长宽比根据数据集标记的矩形框使用k-means算法得到;

B3:根据实际数据集计算先验候选框的尺寸分布,使用(1-IoU)作为距离度量,其中IoU表示先验候选框与标记的矩形框之间面积的交并比,计算公式如下:

其中,A表示先验候选框,B表示标记的矩形框,∩表示A与B的交集,∪表示A与B的并集。

7.根据权利要求6所述的红外图像行人检测方法,其特征在于:所述目标检测FIDN网络以轻量级卷积神经网络作为骨干网络,根据目标检测算法,使用一个1*1的卷积进行预测,所述目标检测算法的定位损失函数为:

其中,λ是一个控制定位损失在总的损失占比的系数,S表示最后卷积的特征图的大小,A表示每个区域生成锚框的个数,是一个0-1函数,如果第i行j列的区域有目标,取值为1,否则取值0,x,y,h,w分别表示中心点的坐标、预测框的高和宽,其中下标带^表示是真实值,没带^的表示预测值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳北斗通信科技有限公司,未经深圳北斗通信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910716970.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top