[发明专利]一种高准确率的基于卷积神经网络的人体多部位识别方法在审

专利信息
申请号: 201610056618.9 申请日: 2016-01-27
公开(公告)号: CN105740892A 公开(公告)日: 2016-07-06
发明(设计)人: 刘波;张恒瑜 申请(专利权)人: 北京工业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 准确率 基于 卷积 神经网络 人体 部位 识别 方法
【说明书】:

技术领域

发明涉及模式识别与深度学习领域,特别是一种高准确率的基于卷积神经网络的人体多部位识别方法。

背景技术

人体识别是计算机视觉的一大热点。在过去,人体识别的大多基于低层次的特征因子和高层次的上下文。SIFT算子和HOG算子便是这其中的常用算子,他们都是基于低层次的方向直方图得来的,但图像的特征是分层的并且是逐层推进的,所以,LeCun等人在Rumelhart等人的研究基础上提出了基于反向传播进行随机梯度下降算法的卷积神经网络(CNN)的训练方法并在当时得到了相当的重视而且在计算机视觉领域形成了新的认知。

虽然CNN在90年代得到了广泛的应用,但是后来还是被支持向量机(SVM)超越,直到2012年Krizhevsky等人在ImageNetLargeScaleVisualRecognitionChallenge(ILSVRC)上的巨大成功才将大众的视野拉回到CNN上来,该算法的成功主要在(1)大数量级的标注数据(2)对LeCun网络结构的改进:激活函数采用f(x)=max(0,x)来提高速度和采用dropout减少过拟合。

虽然CNN在识别领域取得了骄人的成绩,但是CNN做的工作多是分类,而对于识别中的另一个工作——定位涉及较少。RCNN的提出极大地结合了卷积神经网络和多种机器学习算法,化解了识别与定位之间的鸿沟。

人体多部位识别不仅仅需要识别出整个人体,还需要对人体的各个部位进行定位,最终形成对每个人体和其相应部位的整体理解。如何建立随动作姿势和视角变化还能保持较高准确率的整体和各个部位的关联模型称为了重中之重,在过去的方法中,Poselets和DPM等几何约束算法取得了较好的成果,但这些成果大多基于给定的整体边框来定位各个部位的位置,所以以上方法也需要进一步的改进。

发明内容

本发明提供一种高准确率的基于卷积神经网络的人体多部位识别方法。本发明中采用深度卷积神经网络提取图像特征,这种方法充分利用了图像的深度信息,极大的提高了图像的识别准确率;其次,基于RCNN方法利用SelectiveSearch算法形成候选边框,比滑动窗口方法更能适应深度卷积网络下定位信息的准确性;进一步的,通过将卷积神经网络的最后一层Softmax层替换成SVM,最终获得了基于分类的得分;另外,获得各个候选边框的相对于各个类别的SVM得分后,通过添加基于像素的位置范围约束、K近邻约束和混合高斯模型最终形成基于整体理解的候选边框组合,提高了人体多部位识别的准确率,比原有RCNN的方法定位更加精准。

本发明采用如下技术方案:

一种高准确率的基于卷积神经网络的人体多部位识别方法,如图1所示,包括SelectiveSearch图像分割算法,深层卷积神经网络,基于深层特征训练出的支持向量机和三种空间几何约束(空间像素范围约束,K近邻约束,混合高斯模型约束)。当输入一幅RGB图像,首先通过SelectiveSearch算法生成大约2000个候选边框,然后通过卷积神经网络计算这些候选边框的全相连层特征,之后通过全相连层特征进一步计算其支持向量机的分类得分,再然后假定每一个候选边框都为人体整体边框并通过空间几何约束计算其相应的部位边框和该边框组合的得分,最后通过非最大化抑制和阈值的限制获得最终的边框组合并显示出来。

所述的SelectiveSearch算法是一种基于分层区域合并的图像分割方法,本发明中采用SelectiveSearch的快速模式,平均每张图片会产生大约2000个尺寸不一的候选区域边框,此算法的优点是采用多元策略集以便适应几乎所用情况将小区域合并在一起形成分层区域合并的边框范围,另一个优点是计算速度快。其中,区域的合并方式是有层次的、类似于哈夫曼树的构造过程,通过使用EfficientGraph-BasedImageSegmentation的方法获取原始分割区域并通过计算相似度不断对区域进行合并。计算相似度时该算法还充分从颜色、纹理、大小等方面考虑,并将以上方面进行加权得分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610056618.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top