[发明专利]一种基于深度学习级联神经网络的行人检测识别方法在审
| 申请号: | 201910157847.3 | 申请日: | 2019-03-02 |
| 公开(公告)号: | CN109886245A | 公开(公告)日: | 2019-06-14 |
| 发明(设计)人: | 杨阳;冯浩;刘云霞;陈正晓 | 申请(专利权)人: | 山东大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/42;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 许德山 |
| 地址: | 250199 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 身份识别 行人检测 行人识别 数据集 准确率 级联 送入 预处理 图像 视频图像序列 归一化处理 分割图像 局部图像 目标定位 视频监控 特征信息 图像信息 原始信息 智能小区 第一级 分辨率 构建 学习 检测 监管 | ||
本发明涉及一种基于深度学习级联神经网络的行人检测识别方法,包括:(1)将经过预处理的视频图像序列送入第一级神经网络,获取行人在图像中的原始信息;(2)分割图像中行人的局部图像并归一化处理,构建行人识别数据集;(3)将行人识别数据集送入第二级神经网络,提取行人的特征信息,实现对行人的身份识别。本发明解决了图像中目标定位不准确、行人分辨率较低、行人身份识别准确率不高等问题,可以得到目标行人相对较好的图像信息,本发明提高了行人检测识别的准确率。本发明方法实践效果较好,运行速度较快,可以实时、快速、准确的实现对目标行人的检测与身份识别,适用于视频监控、智能小区、特定场所监管等众多领域。
技术领域
本发明涉及一种基于深度学习级联神经网络的行人检测识别方法,属于目标检测、身份识别等领域。
背景技术
随着目标检测技术的发展,把目标检测应用于视频监控系统来简化人的操作,为人类提供便利已成为目前的研究热点。虽然目标检测在物体的类别检测上已经取得了一定的进展,但是对于相同类别物体之间的差异并不敏感,例如:当应用到行人身份识别时,如果直接将原始的视频图像序列送入神经网络,对目标行人的身份进行识别,神经网络对图像的预处理(如尺度缩放)会降低行人的分辨率,损失行人的部分特征信息,导致行人检测识别的效果较差。
中国专利文献CN 108629360A公开了一种基于深度学习的针织物基本组织结构自动识别方法,该方法包括:采集织物样本图像;基于深度卷积神经网络算法,结合学习迁移策略,针对织物样本集训练出可识别针织物基本组织的网络模型;输入待测织物组织图片并进行预处理,加载训练好的网络模型对待测织物组织图片进行识别,最终输出识别结果。第一,织物样本图像是直接使用电子显微镜获取的,可以根据实验需求得到想要的织物样本数据集,而行人图像则需要从不同分辨率的摄像头中采集原始数据,并通过定位行人在图像中的位置,裁剪行人所在区域的图像构建行人数据集,两者有本质不同;第二,该专利使用的AlexNet属于深度学习早期使用的网络,结构比较简单,在提取图像中的复杂特征时效果并不好。
发明内容
针对现有技术的不足,本发明提供了一种基于深度学习级联神经网络的行人检测识别方法;
本发明提出的基于深度学习级联神经网络的行人检测识别方法,对视频监控系统中的行人检测识别进行了优化。首先,将经过预处理的视频图像序列送入第一级神经网络,进行目标行人的检测,获取行人在图像中的位置信息;然后,根据行人的位置信息分割图像中行人的局部图像并归一化处理,构建行人识别数据集;最后,将行人识别数据集送入第二级神经网络,提取行人的特征信息,实现对行人的身份识别。
术语解释:
ster R-CNN,一种基于深度学习卷积神经网络的目标检测方法,发展于R-CNN、Fast R-CNN系列的目标检测方法,Faster R-CNN相比Fast R-CNN,增加了一个用于感兴趣区域提取的RPN网络,不仅提高了感兴趣区域的质量,而且极大提升了网络的速度。图1为基于ResNet-50的Faster R-CNN的网络结构图;左下角head是ResNet-50的网络结构,作用等同于Alex,但是对于目标检测、身份识别等复杂的分类任务,ResNet-50能提取到图像更深层次的特征,分类效果更好。左上角即为Faster R-CNN相比Fast R-CNN增加的RPN网络,将head网络提取到的特征经过两个分支(分类、目标定位),提高了感兴趣区域的精度。右下角是网络最终的分类层,实现图像中目标的分类。
本发明的技术方案为:
一种基于深度学习级联神经网络的行人检测识别方法,包括步骤如下:
(1)下载有关行人的图像数据集,并将此数据集送入第一级神经网络进行训练,得到一个用于行人检测的模型;
(2)采集摄像头拍摄的视频图像序列,并进行预处理,之后送入通过步骤(1)中训练得到的用于行人检测的模型,对图像中的行人进行检测,获取图像中行人的位置信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910157847.3/2.html,转载请声明来源钻瓜专利网。





