[发明专利]复杂场景下行人细粒度属性的检测与识别方法有效
申请号: | 201810295592.2 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108510000B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 于重重;马先钦;周兰;王鑫 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100048*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 场景 行人 细粒度 属性 检测 识别 方法 | ||
本发明公布了一种复杂场景下行人细粒度属性的识别方法,采用分类模型对检测出的行人的子部件进行细粒度属性识别;将识别出的属性分别与行人性别进行关联分析,选取相关性强的属性进行多任务学习;再训练多任务学习构建的卷积神经网络模型,并针对多个属性选出识别正确率最高的卷积神经网络模型结果,作为最终结果;最后根据自定义的决策函数来判断行人的性别属性。本发明可实现对复杂场景中行人由整体到局部的检测,实现对行人子部件属性更精准的检测与识别,能够避免背景等信息的干扰,同时也解决了模型对小目标检测正确率低的问题,具有较高的识别精度。
技术领域
本发明属于模式识别和机器视觉技术领域,涉及目标检测与识别技术,尤其涉及一种针对复杂场景下行人细粒度属性的检测与识别方法。
背景技术
近年来,随着模式识别和机器视觉的发展,目标检测与识别技术得到了很大的发展,并且在视频场景监控,机器人控制,智能交通,以及无人驾驶汽车等领域实现了大量的应用。
目标检测与识别的方法主要分为两个步骤,第一步是目标检测,第二步是图像分类。传统的目标检测方法主要是采用滑动窗口+手工设计特征,主要方法有基于特征描述子的、基于形状特征的和基于边缘的目标检测;传统的分类方法主要采用Adaboost集成学习、支持向量机(Support Vector Machine,SVM)等。传统的目标检测与识别方法,主要是采用滑动窗口的方法进行窗口提名,这种方法的实质是穷举法。此方法不仅复杂度高、鲁棒性差,而且产生了大量的候选区冗余区域。
2014年,Ross B.Girshick使用候选区域(region proposal)+分类卷积神经网络(CNN)模型,设计了R-CNN框架,使得目标检测与识别取得巨大突破,并开启了基于深度学习的目标检测与识别的热潮。(Liang M,Hu X.Recurrent convolutional neural networkfor object recognition[C]Computer Vision and Pattern Recognition(CVPR).IEEE,2015:3367-3375.)
Ren S等提出了Faster R-CNN:在实时对象检测和候选区域网络间引入了一个区域建议网络(RPN),它与检测网络共享映像卷积功能,从而提供了一个近乎没有成本的区域建议。(Ren S,He K,Girshick R,et al.Faster R-CNN:Towards Real-Time ObjectDetection with Region Proposal Networks[J].IEEE Transactions on PatternAnalysisMachine Intelligence,2017,39(6):1137-1149.)
Wang X等提出了A-Fast-RCNN:通过对手的硬阳性生成对象检测,建议学习一个对抗性的网络,产生的例子与闭塞和变形,在框架中的原始探测器和对手的共同学习的方式。(Wang X,Shrivastava A,Gupta A.A-Fast-RCNN:Hard Positive Generation viaAdversary for Object Detection[J].2017.)
Liu L等提出了Highly Occluded Face Detection:改进的R-FCN,提出的算法是基于区域全卷积网络(R-FCN)与两个改进的部分,鲁棒人脸检测,包括多尺度训练和一个新的特征融合方案。(Liu L,Jiang F,Shen R.Highly Occluded Face Detection:AnImproved R-FCN Approach[M]Neural Information Processing.2017.)
基于R-CNN框架的深度学习方法,解决了传统目标检测使用的滑动窗口存在的问题,在鲁棒性和准确率方面有明显进步,但是存在重复计算、训练耗时、步骤繁琐等问题。基于回归方法的端到端的深度学习目标检测算法无需region proposal,直接采用回归完成目标位置和类别的判定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810295592.2/2.html,转载请声明来源钻瓜专利网。