[发明专利]一种基于深度学习级联神经网络的行人检测识别方法在审

申请号：	201910157847.3	申请日：	2019-03-02
公开（公告）号：	CN109886245A	公开（公告）日：	2019-06-14
发明（设计）人：	杨阳;冯浩;刘云霞;陈正晓	申请（专利权）人：	山东大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32;G06K9/34;G06K9/42;G06K9/62;G06N3/04;G06N3/08
代理公司：	济南金迪知识产权代理有限公司 37219	代理人：	许德山
地址：	250199 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络身份识别行人检测行人识别数据集准确率级联送入预处理图像视频图像序列归一化处理分割图像局部图像目标定位视频监控特征信息图像信息原始信息智能小区第一级分辨率构建学习检测监管
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于深度学习级联神经网络的行人检测识别方法，包括：(1)将经过预处理的视频图像序列送入第一级神经网络，获取行人在图像中的原始信息；(2)分割图像中行人的局部图像并归一化处理，构建行人识别数据集；(3)将行人识别数据集送入第二级神经网络，提取行人的特征信息，实现对行人的身份识别。本发明解决了图像中目标定位不准确、行人分辨率较低、行人身份识别准确率不高等问题，可以得到目标行人相对较好的图像信息，本发明提高了行人检测识别的准确率。本发明方法实践效果较好，运行速度较快，可以实时、快速、准确的实现对目标行人的检测与身份识别，适用于视频监控、智能小区、特定场所监管等众多领域。

技术领域

本发明涉及一种基于深度学习级联神经网络的行人检测识别方法，属于目标检测、身份识别等领域。

背景技术

随着目标检测技术的发展，把目标检测应用于视频监控系统来简化人的操作，为人类提供便利已成为目前的研究热点。虽然目标检测在物体的类别检测上已经取得了一定的进展，但是对于相同类别物体之间的差异并不敏感，例如：当应用到行人身份识别时，如果直接将原始的视频图像序列送入神经网络，对目标行人的身份进行识别，神经网络对图像的预处理(如尺度缩放)会降低行人的分辨率，损失行人的部分特征信息，导致行人检测识别的效果较差。

中国专利文献CN 108629360A公开了一种基于深度学习的针织物基本组织结构自动识别方法，该方法包括：采集织物样本图像；基于深度卷积神经网络算法，结合学习迁移策略，针对织物样本集训练出可识别针织物基本组织的网络模型；输入待测织物组织图片并进行预处理，加载训练好的网络模型对待测织物组织图片进行识别，最终输出识别结果。第一，织物样本图像是直接使用电子显微镜获取的，可以根据实验需求得到想要的织物样本数据集，而行人图像则需要从不同分辨率的摄像头中采集原始数据，并通过定位行人在图像中的位置，裁剪行人所在区域的图像构建行人数据集，两者有本质不同；第二，该专利使用的AlexNet属于深度学习早期使用的网络，结构比较简单，在提取图像中的复杂特征时效果并不好。

发明内容

针对现有技术的不足，本发明提供了一种基于深度学习级联神经网络的行人检测识别方法；

本发明提出的基于深度学习级联神经网络的行人检测识别方法，对视频监控系统中的行人检测识别进行了优化。首先，将经过预处理的视频图像序列送入第一级神经网络，进行目标行人的检测，获取行人在图像中的位置信息；然后，根据行人的位置信息分割图像中行人的局部图像并归一化处理，构建行人识别数据集；最后，将行人识别数据集送入第二级神经网络，提取行人的特征信息，实现对行人的身份识别。

术语解释：

ster R-CNN，一种基于深度学习卷积神经网络的目标检测方法，发展于R-CNN、Fast R-CNN系列的目标检测方法，Faster R-CNN相比Fast R-CNN，增加了一个用于感兴趣区域提取的RPN网络，不仅提高了感兴趣区域的质量，而且极大提升了网络的速度。图1为基于ResNet-50的Faster R-CNN的网络结构图；左下角head是ResNet-50的网络结构，作用等同于Alex，但是对于目标检测、身份识别等复杂的分类任务，ResNet-50能提取到图像更深层次的特征，分类效果更好。左上角即为Faster R-CNN相比Fast R-CNN增加的RPN网络，将head网络提取到的特征经过两个分支(分类、目标定位)，提高了感兴趣区域的精度。右下角是网络最终的分类层，实现图像中目标的分类。

本发明的技术方案为：

一种基于深度学习级联神经网络的行人检测识别方法，包括步骤如下：

(1)下载有关行人的图像数据集，并将此数据集送入第一级神经网络进行训练，得到一个用于行人检测的模型；

(2)采集摄像头拍摄的视频图像序列，并进行预处理，之后送入通过步骤(1)中训练得到的用于行人检测的模型，对图像中的行人进行检测，获取图像中行人的位置信息；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东大学，未经山东大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910157847.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种人脸识别活体检测方法及装置
下一篇：具有人眼专注度辨识功能的导游机器人脸部装置及控制

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习级联神经网络的行人检测识别方法在审

专利文献下载