[发明专利]一种基于深信度网络的人车分类方法有效
| 申请号: | 201410007538.5 | 申请日: | 2014-01-08 |
| 公开(公告)号: | CN103778432B | 公开(公告)日: | 2017-02-01 |
| 发明(设计)人: | 孙宁;吴秦龙;韩光;李晓飞 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 南京经纬专利商标代理有限公司32200 | 代理人: | 朱小兵 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深信 网络 分类 方法 | ||
技术领域
本发明属于图像处理和人工智能技术领域,具体涉及一种基于深信度网络的人车分类方法。
背景技术
随着我国智慧城市建设不断走向深入,智能视频监控系统以其高清化、网络化和智能化等优点已经成为智慧城市的必不可少重要特征之一。其中,行人和车辆是智能视频监控系统重点关注的两类目标,进行人车分类信息是公安图像侦查和交通状态分析的重要组成部分。因此,基于图像分析和人工智能的人车分类方法是智能视频监控系统的关键技术,已成为国内外相关领域的研究热点。
人车分类的一般流程包括目标图像获取、目标特征提取、构造分类器和人车分类判别等步骤。在目标特征提取方面,HOG算子、LBP算子、不变距特征和几何比例特征等方法被用来进行目标特征表征。然而,每种特征提取方法都有相应的最佳使用场合,且不可避免的要丢失原始图像的部分信息,很难在目标光照,外观,尺寸大幅变化的情况下维持有效的特征表征;在分类器方面,SVM,神经网络,贝叶斯决策等理论广泛应用于图像分类领域。其中,基于SVM的方法分类性能最佳,并且能在小样本条件下取得良好的识别性能。但是,对于智能视频监控系统中获取的海量人车图像构成的大数据图像样本,SVM方法则存在寻优时间漫长和易陷入局部最优的问题。
发明内容
本发明所要解决的技术问题是为了克服现有技术的不足,提出一种基于深信度网络的人车分类方法。所述方法应用于智能视频监控系统中,可以对在光照、视角、分辨率等方面存在大幅差异的人车图像,实现稳健和高性能的分类功能。
本发明为解决上述技术问题,采用如下技术方案:一种基于深信度网络的人车分类方法,包括步骤如下:
步骤A,图像特征提取:
将不同尺寸的训练图像归一化为同一大小的灰度图像Ig,提取灰度图像Ig的方向梯度直方图HOG算子,得到灰度图像的HOG特征直方图Hg;将灰度图像Ig拉直后与HOG特征直方图Hg串联,构成联合图像特征Vi;
步骤B,构造深信度网络DBN:
所述DBN基于受限波尔兹曼机RBM,确定DBN的网络层数及各层节点数量;
步骤C,训练DBN:
将联合图像特征Vi输入DBN,先逐层贪婪训练DBN,再使用反向传播BP算法,调整DBN参数,完成DBN的训练;
步骤D,进行人车分类:
将待分类图像进行归一化和HOG特征提取后,形成联合图像特征Vt,输入步骤C训练完成的DBN中,进行人车分类。
步骤A中,所述图像特征提取,具体过程如下:
步骤A-1,将训练图像归一化为96×144的灰度图像Ig;
步骤A-2,使用HOG算子对Ig进行特征提取,获得1×6732维的HOG特征直方图Hg;
步骤A-3,将Ig拉直后和Hg串联成联合图像特征Vi,为一个1×20556的向量。
步骤B中,所述构造深信度网络DBN,具体包括以下步骤:
步骤B-1,构造基于RBM的5层DBN,包括1个输入层,3个隐藏层和1个分类层;
步骤B-2,指定DBN的输入层节点数为20556;第一个隐藏层节点数为500;第二个隐藏层节点数为500;第三个隐藏层节点数为2000;分类层的节点数为2。
步骤C中,所述训练DBN,具体包括以下步骤:
步骤C-1,使用对比散度CD算法对DBN的前4层进行逐层训练,计算3个隐藏层的输出值和各层之间的权值及偏置;
步骤C-2,使用softmax回归模型训练DBN的分类层;
步骤C-3,使用BP算法对整个DBN进行调整,优化DBN参数,完成DBN的全局训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410007538.5/2.html,转载请声明来源钻瓜专利网。





