[发明专利]基于深度卷积网络的行人检测方法及装置有效
| 申请号: | 201410301823.8 | 申请日: | 2014-06-27 |
| 公开(公告)号: | CN104063719B | 公开(公告)日: | 2018-01-26 |
| 发明(设计)人: | 汪永强;童庆;刘文昌;莫永波;胡祝银 | 申请(专利权)人: | 深圳市赛为智能股份有限公司 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66 |
| 代理公司: | 深圳市博锐专利事务所44275 | 代理人: | 张明 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 卷积 网络 行人 检测 方法 装置 | ||
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于深度卷积网络的行人检测方法及装置。
背景技术
随着科技的发展,智能视频监控技术渐渐成为视频监控技术的研究热点之一。所谓“智能化”,就是要充分挖掘抽取视频资源中的关键信息,并利用这种信息为用户提供有价值的服务。比如,当监控系统发现一个来历不明的物品较长时间地出现在安全区域,或者发现可疑人物游荡在安全管理的区域以及其他的异常行为时,系统能对这样一些具有潜在威胁的事件及时捕获,并对是否介入事件做出智能的判断,从而有效抑制人作为行为主体所引致的系列问题,实现真正意义上的全天候的监控。
智能化监控系统除了可以提高报警精确度,减少漏分析或者误分析的现象外,还可以缩短响应时间,提高响应速度,形成更为有效的现场数据,在安全威胁发生之前就能够提示安全人员关注相关监控画面,为潜在威胁做好准备工作。于是,近年来,智能视频监控系统也开始在一些特定的场合,如车站、银行、商场等公共领域逐渐普及,所以安全领域成为主要应用场所。
实际上,目前大多数监控系统都还停留在普通的网络视频监控(IP监控、数字化监控)的概念上。简单地说,“眼睛”到处都有,但是智能化的程度并不高,还处于比较初始的阶段。一些智能化监控系统还只能分析一些较为简单的异常行为,其光照环境适应性也处在较低的水平,离用户所期望的理想效果还差得比较远。随着市场上对智能视频应用需求的不断提升,很多科研机构和厂商正投入大量的资金和研发力量从事监控系统智能化的研究。研发出了一批相关技术和产品。
而行人作为视频监控的主体,又有着其特殊的研究地位。所以对行人的检测与识别技术的研究在智能视频监控中有着重要的意义。行人检测可定义为:判断输入图片(或视频帧)是否包含行人,如果有,给出位置信息。它是车辆辅助驾驶、智能视频监控和人体行为分析等应用中的第一步,近年来也应用在航拍图像、受害者营救等新兴领域中.行人兼具刚性和柔性物体的特性,外观易受穿着、尺度、遮挡、姿态和视角等影响,使得行人检测成为智能视频监控的研究难点与热点。
目前常用的行人检测方法主要有背景差法、帧差法、光流法,模版匹配和基于机器学习的方法等。前四种检测方法都是常规的基于图像处理技术的人体检测方法,然而这些方法不能解决人体形状和外貌各式各样的难点,人体的不同运动方式的问题,受天气以及光照的随机变化,行人的服饰和姿态改变影响,较大。基于机器学习的方法从样本集中学习人体的不同变化,具有较好的鲁棒性,而且合理的选择训练样本和特征,结合结构合理的分类算法,可以较好地克服许多不利条件,如行人多样性、场景多样性、光照环境多样性等的影响,从而有很好的推广性和广泛的适用范围。由于基于机器学习的行人检测方法的优点,它已经成为目前行人检测的一种主流的方法。
基于机器学习的方法一般包括特征提取和训练机器学习分类器,检测三个部分。用于行人检测的特征有:Haar特征,Hog特征,Edgelet特征,FDF特征等。用于行人检测的机器学习算法有:支持向量机(SVM)、各种类型的神经网络(NN)以及其他基于统计的学习分类器(如Adaboost、级联分类器)等。行人检测除了具有一般人体检测具有的服饰变化、姿态变化等难点外,由于其特定的应用领域还具有以下难点:摄像机是运动的,这样广泛应用于智能监控领域中检测动态目标的方法便不能直接使用;行人检测面临的是一个开放的环境,要考虑不同的路况、天气和光线变化,对算法的鲁棒性提出了很高的要求;实时性是系统必须满足的要求,这就要求采用的图像处理算法不能太复杂。由于传统的算法对以上问题的适应性都不好,所以要提出一种新的方法来解决上述问题。
发明内容
本发明所要解决的技术问题是:提供一种鲁棒性较佳、检测准确率高的基于深度卷积网络的行人检测方法及装置。
为了解决上述技术问题,本发明采用的技术方案为:提供一种基于深度卷积网络的行人检测方法,包括卷积神经网络训练步骤和行人检测步骤;
所述卷积神经网络训练步骤包括如下步骤:
S10、从图像库中选取多组样本图像数据;
S11、将一组样本图像数据送入多层神经卷积网络的输入层,并给定输出层正确的输出结果,其中,所述多层神经网络是基于神经元模型而构建,每个神经元包括输入层、中间层及输出层;
S12、计算卷积神经网络的中间层的输出矢量以及输出层的实际输出矢量后,将中间层的输出矢量以及输出层的实际输出矢量中的元素分别与正确输出矢量中的元素比较,得出中间层误差以及输出层误差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市赛为智能股份有限公司,未经深圳市赛为智能股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410301823.8/2.html,转载请声明来源钻瓜专利网。





