[发明专利]基于深度学习的手部关键点检测方法在审
申请号: | 201910325729.9 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110222558A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 强保华;张世豪;赵天;陶林;谢武 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/04 |
代理公司: | 广州市一新专利商标事务所有限公司 44220 | 代理人: | 侯腾腾 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 神经网络模型 关键点检测 数据层 手部 准确度 模型参数 模型训练 网络模型 网络层 减小 卷积 链接 剔除 删除 学习 检测 保留 改进 | ||
本发明公开了一种基于深度学习的手部关键点检测方法,所述方法包括了CPMs卷积神经网络和GoogLeNet神经网络模型。所述CPMs卷积神经网络中,保留stage1中的数据层和最后七个卷积层,将stage1中的其他层剔除掉。所述GoogLeNet神经网络模型中,选用其前13网络层,并删除其中的数据层和inception(3b)后面的max pool层。将所述CPMs卷积神经网络和所述GoogLeNet神经网络模型结合起来,修改每一层的bottom属性、top属性的名称,使得层与层之间能够链接起来。本发明改进了网络模型结构,提高了关键点检测的准确度和减小了模型训练的代价(训练时间等),减少了模型参数得以加快检测速度。
技术领域
本发明涉及手部关键点检测领域,具体涉及一种基于深度学习的手部关键点检测方法。
背景技术
人体骨骼关键点检测是计算机视觉的基础性算法之一,在其他相关领域的研究中都起到了基础性作用,如行为识别、人物跟踪、步态识别等相关领域;具体应用主要集中在智能视频监控,病人监护系统,人机交互,虚拟现实,人体动画,智能家居,运动员辅助训练等等,其中手部关键点检测是人体骨骼关键点检测的重要拓展部分,也是人体骨骼关键点检测的具体应用领域。
2015年的Flowing Convnet将人体骨骼关键点检测看作是检测问题,输出结果是heatmap,该模型只能检测出人体上半身的人体骨骼关键点,检测范围有限。2016年的DeepCut和之后改进的DeeperCut两个模型,检测范围为全身的人体骨骼关键点,而且检测准确率和检测速度都有所提升。之后的Convolutional Pose Machines (CPMs)具有很强的鲁棒性,在MPII,LSP等人体姿态估计的标准数据集上的检测准确率也非常高,但是检测速度无法做到实时,训练的时间也比较长;同时期的Stacked Hourglass在人体骨骼关键点检测的标准数据集上也取得了非常不错的检测效果。2017年的Multi-context、SelfAdversarial Training、Learning Feature等模型以及2018年的优秀模型基本上是基于Stacked Hourglass改进设计的新模型,准确率方面得到了进一步提升。然而上述这些模型共同的不足之处是模型参数比较多,模型训练的时间比较长,模型检测的准确率还有上升的空间。
发明内容
为克服上述现有模型的不足,本发明提供一种基于深度学习的手部关键点检测方法,本发明主要包括改进网络模型结构以提高关键点检测的准确度和减小模型训练的代价(训练时间等),减少模型参数以加快检测速度,并将其应用于手部关键点检测这几个方面。
本发明以CPMs卷积神经网络为基础,结合GoogLeNet神经网络模型,构建了一种全新的手部关键点检测模型。所述CPMs卷积神经网络中保留stage1中的数据层、最后七个卷积层以及stage2~stage6中的所有层,将stage1中的其他层剔除掉;所述GoogLeNet神经网络模型中选用其前13网络层,并删除其中的数据层和inception(3b)后面的max pool层;将所述CPMs卷积神经网络和所述GoogLeNet神经网络模型结合起来,修改每一层的bottom属性和top属性的名称使得层与层之间能够链接起来。最后通过在每一个stage的输出位置定义一个loss函数,即添加一个EuclideanLoss层,使得每一个手部关键点的预测响应图与它的真实标注响应图之间的距离达到最小,并应用微调的策略对网络进行训练从而引导网络模型达到一个预期的效果。
附图说明
图1为本发明的流程图;
图2为本发明中手部关键点特征提取以及手部关键点检测的过程图;
图3为本发明中GoogLeNet13-CPM-Stage6网络的网络结构图。
图4为本发明中GoogLeNet13-CPM-Stage6网络的原理图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910325729.9/2.html,转载请声明来源钻瓜专利网。