[发明专利]一种骨架检测模型的构建方法、图像数据识别方法有效
申请号: | 202211592632.2 | 申请日: | 2022-12-13 |
公开(公告)号: | CN115620016B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 项乐宏;王翀;夏银水;李裕麒;郑瑜杰 | 申请(专利权)人: | 乐歌人体工学科技股份有限公司 |
主分类号: | G06V10/34 | 分类号: | G06V10/34;G06T7/73;G06V10/82;G06V40/10 |
代理公司: | 浙江中桓凯通专利代理有限公司 33376 | 代理人: | 刘潇 |
地址: | 315100 浙江省宁波市鄞州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 骨架 检测 模型 构建 方法 图像 数据 识别 | ||
本发明提供了一种骨架检测模型的构建方法、图像数据识别方法。构建方法包括:根据训练图像,获取训练RGB图像和训练深度图像;将训练RGB图像和训练深度图像输入训练网络,分别获取第一热力图和第二热力图;将标签转换为第一正确热力图,计算第一热力图和第一正确热力图的第一损失,以及第二热力图和第一正确热力图的第二损失;根据第一热力图和第二热力图,通过热图回归技术,分别确定第一骨架关键点和第二骨架关键点;将第一骨架关键点和第二骨架关键点采用均方误差计算第三损失;根据第一损失、第二损失和第三损失的叠加优化训练网络的参数。本发明解决的问题是:现有技术无法通过模型训练有效地提高骨架检测模型的鲁棒性。
技术领域
本发明涉及图像数据处理技术领域,具体而言,涉及一种骨架检测模型的构建方法、图像数据识别方法。
背景技术
人体姿态识别是检测图像或者视频中人体关键点的位置、构建人体骨架图的过程。利用人体姿态信息可以进一步进行动作识别、人机信息交互、异常行为检测等任务。然而,人的肢体比较灵活,姿态特征在视觉上变化比较大,并且容易受到视角和服饰变化的影响。
现有技术中,对人体姿态的识别往往使用HRNet骨架模型进行骨架关键点的检测,而传统的HRNet仅使用RGB图像对模型进行训练,导致最终训练完成的HRNet骨架模型的准确性和鲁棒性不够,进而导致人体姿态检测精度不够。
由此可见,相关技术中存在的问题是:现有技术无法通过模型训练有效地提高骨架检测模型的鲁棒性。
发明内容
本发明解决的问题是:现有技术无法通过模型训练有效地提高骨架检测模型的鲁棒性。
为解决上述问题,本发明的第一目的在于提供一种基于多视图知识蒸馏的骨架检测模型的构建方法,
本发明的第二目的在于提供一种人体姿态的图像数据识别方法。
为实现本发明的第一目的,本发明的实施例提供了一种基于多视图知识蒸馏的骨架检测模型的构建方法,构建方法包括:
S100:获取带有标签的训练图像,对训练图像打标签是指,将训练图像的人体骨架关键点坐标和训练图像建立对应关系;
S200:根据训练图像,获取训练RGB图像和训练深度图像;
S300:将训练RGB图像和训练深度图像输入训练网络,分别获取第一热力图和第二热力图;
S400:将标签转换为第一正确热力图,计算第一热力图和第一正确热力图的第一损失,以及第二热力图和第一正确热力图的第二损失;
S500:根据第一热力图和第二热力图,通过热图回归技术,分别确定第一骨架关键点和第二骨架关键点;
S600:将第一骨架关键点和第二骨架关键点采用均方误差计算第三损失;
S700:根据第一损失、第二损失和第三损失的叠加优化训练网络的参数;
S800:获取多幅带有标签的训练图像,循环S100至S700的步骤,迭代至损失收敛,完成训练,将训练网络的参数固定,由此构建骨架检测模型。
与现有技术相比,采用该技术方案所达到的技术效果:经过多视图知识蒸馏的HRNet对于同一场景的不同视图具有更好的鲁棒性,使用本发明的构建方法能够有效地提高骨架检测模型的鲁棒性,构建的骨架检测模型能够有效地提高人体骨架检测的精度。
在本发明的一个实施例中,计算第一损失和第二损失的函数为OHKM损失函数。
与现有技术相比,采用该技术方案所达到的技术效果:本实施例的方法采用OHKM损失函数,使获得的第一损失和第二损失更加准确。
在本发明的一个实施例中,在S400之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐歌人体工学科技股份有限公司,未经乐歌人体工学科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211592632.2/2.html,转载请声明来源钻瓜专利网。