[发明专利]一种基于深度学习级联神经网络的行人检测识别方法在审

专利信息
申请号: 201910157847.3 申请日: 2019-03-02
公开(公告)号: CN109886245A 公开(公告)日: 2019-06-14
发明(设计)人: 杨阳;冯浩;刘云霞;陈正晓 申请(专利权)人: 山东大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06K9/34;G06K9/42;G06K9/62;G06N3/04;G06N3/08
代理公司: 济南金迪知识产权代理有限公司 37219 代理人: 许德山
地址: 250199 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 身份识别 行人检测 行人识别 数据集 准确率 级联 送入 预处理 图像 视频图像序列 归一化处理 分割图像 局部图像 目标定位 视频监控 特征信息 图像信息 原始信息 智能小区 第一级 分辨率 构建 学习 检测 监管
【说明书】:

本发明涉及一种基于深度学习级联神经网络的行人检测识别方法,包括:(1)将经过预处理的视频图像序列送入第一级神经网络,获取行人在图像中的原始信息;(2)分割图像中行人的局部图像并归一化处理,构建行人识别数据集;(3)将行人识别数据集送入第二级神经网络,提取行人的特征信息,实现对行人的身份识别。本发明解决了图像中目标定位不准确、行人分辨率较低、行人身份识别准确率不高等问题,可以得到目标行人相对较好的图像信息,本发明提高了行人检测识别的准确率。本发明方法实践效果较好,运行速度较快,可以实时、快速、准确的实现对目标行人的检测与身份识别,适用于视频监控、智能小区、特定场所监管等众多领域。

技术领域

本发明涉及一种基于深度学习级联神经网络的行人检测识别方法,属于目标检测、身份识别等领域。

背景技术

随着目标检测技术的发展,把目标检测应用于视频监控系统来简化人的操作,为人类提供便利已成为目前的研究热点。虽然目标检测在物体的类别检测上已经取得了一定的进展,但是对于相同类别物体之间的差异并不敏感,例如:当应用到行人身份识别时,如果直接将原始的视频图像序列送入神经网络,对目标行人的身份进行识别,神经网络对图像的预处理(如尺度缩放)会降低行人的分辨率,损失行人的部分特征信息,导致行人检测识别的效果较差。

中国专利文献CN 108629360A公开了一种基于深度学习的针织物基本组织结构自动识别方法,该方法包括:采集织物样本图像;基于深度卷积神经网络算法,结合学习迁移策略,针对织物样本集训练出可识别针织物基本组织的网络模型;输入待测织物组织图片并进行预处理,加载训练好的网络模型对待测织物组织图片进行识别,最终输出识别结果。第一,织物样本图像是直接使用电子显微镜获取的,可以根据实验需求得到想要的织物样本数据集,而行人图像则需要从不同分辨率的摄像头中采集原始数据,并通过定位行人在图像中的位置,裁剪行人所在区域的图像构建行人数据集,两者有本质不同;第二,该专利使用的AlexNet属于深度学习早期使用的网络,结构比较简单,在提取图像中的复杂特征时效果并不好。

发明内容

针对现有技术的不足,本发明提供了一种基于深度学习级联神经网络的行人检测识别方法;

本发明提出的基于深度学习级联神经网络的行人检测识别方法,对视频监控系统中的行人检测识别进行了优化。首先,将经过预处理的视频图像序列送入第一级神经网络,进行目标行人的检测,获取行人在图像中的位置信息;然后,根据行人的位置信息分割图像中行人的局部图像并归一化处理,构建行人识别数据集;最后,将行人识别数据集送入第二级神经网络,提取行人的特征信息,实现对行人的身份识别。

术语解释:

ster R-CNN,一种基于深度学习卷积神经网络的目标检测方法,发展于R-CNN、Fast R-CNN系列的目标检测方法,Faster R-CNN相比Fast R-CNN,增加了一个用于感兴趣区域提取的RPN网络,不仅提高了感兴趣区域的质量,而且极大提升了网络的速度。图1为基于ResNet-50的Faster R-CNN的网络结构图;左下角head是ResNet-50的网络结构,作用等同于Alex,但是对于目标检测、身份识别等复杂的分类任务,ResNet-50能提取到图像更深层次的特征,分类效果更好。左上角即为Faster R-CNN相比Fast R-CNN增加的RPN网络,将head网络提取到的特征经过两个分支(分类、目标定位),提高了感兴趣区域的精度。右下角是网络最终的分类层,实现图像中目标的分类。

本发明的技术方案为:

一种基于深度学习级联神经网络的行人检测识别方法,包括步骤如下:

(1)下载有关行人的图像数据集,并将此数据集送入第一级神经网络进行训练,得到一个用于行人检测的模型;

(2)采集摄像头拍摄的视频图像序列,并进行预处理,之后送入通过步骤(1)中训练得到的用于行人检测的模型,对图像中的行人进行检测,获取图像中行人的位置信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910157847.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top