[发明专利]一种骨架检测模型的构建方法、图像数据识别方法有效
申请号: | 202211592632.2 | 申请日: | 2022-12-13 |
公开(公告)号: | CN115620016B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 项乐宏;王翀;夏银水;李裕麒;郑瑜杰 | 申请(专利权)人: | 乐歌人体工学科技股份有限公司 |
主分类号: | G06V10/34 | 分类号: | G06V10/34;G06T7/73;G06V10/82;G06V40/10 |
代理公司: | 浙江中桓凯通专利代理有限公司 33376 | 代理人: | 刘潇 |
地址: | 315100 浙江省宁波市鄞州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 骨架 检测 模型 构建 方法 图像 数据 识别 | ||
1.一种基于多视图知识蒸馏的骨架检测模型的构建方法,其特征在于,所述构建方法包括:
S100:获取带有标签的训练图像,对所述训练图像打标签是指,将所述训练图像的人体骨架关键点坐标和所述训练图像建立对应关系;
S200:根据所述训练图像,获取训练RGB图像和训练深度图像;
S300:将所述训练RGB图像和所述训练深度图像输入训练网络,分别获取第一热力图和第二热力图;
S400:将所述标签转换为第一正确热力图,计算所述第一热力图和所述第一正确热力图的第一损失,以及所述第二热力图和所述第一正确热力图的第二损失;
S500:根据所述第一热力图和所述第二热力图,通过热图回归技术,分别确定第一骨架关键点和第二骨架关键点;
S600:将所述第一骨架关键点和所述第二骨架关键点采用均方误差计算第三损失;
S700:根据所述第一损失、所述第二损失和所述第三损失的叠加优化所述训练网络的参数;
S800:获取多幅带有标签的训练图像,循环所述S100至所述S700的步骤,迭代至损失收敛,完成训练,将所述训练网络的参数固定,由此构建骨架检测模型。
2.根据权利要求1所述的构建方法,其特征在于,计算所述第一损失和所述第二损失的函数为OHKM损失函数。
3.根据权利要求1所述的构建方法,其特征在于,
在所述S400之后,还包括:
S450:将所述第一热力图和所述第二热力图采用均方误差计算第四损失;
所述S700包括:
根据所述第一损失、所述第二损失、所述第三损失和所述第四损失叠加优化所述训练网络的参数。
4.根据权利要求1所述的构建方法,其特征在于,所述S300包括:
S310:获取所述训练网络的目标通道数量n;
S320:将所述训练RGB图像和所述训练深度图像复制转化为通道数量为所述目标通道数量n的图像后输入所述训练网络,分别获取所述第一热力图和所述第二热力图。
5.根据权利要求1所述的构建方法,其特征在于,所述S700包括:
根据所述第一损失、所述第二损失和所述第三损失的叠加,使用梯度下降法优化所述训练网络的参数。
6.一种人体姿态的图像数据识别方法,其特征在于,所述图像数据识别方法使用如权利要求1至5任一项所述的构建方法构建出的骨架检测模型,所述图像数据识别方法包括:
获取用户的RGB图像;
将所述RGB图像输入所述骨架检测模型,获取第一人体骨架关键点坐标;
其中,所述第一人体骨架关键点坐标为2D骨架关键点坐标。
7.一种人体姿态的图像数据识别方法,其特征在于,所述图像数据识别方法使用如权利要求1至5任一项所述的构建方法构建出的骨架检测模型,所述图像数据识别方法包括:
获取用户的深度图像;
将所述深度图像输入所述骨架检测模型,获取第二人体骨架关键点坐标;
其中,所述第二人体骨架关键点坐标为3D骨架关键点坐标。
8.一种人体姿态的图像数据识别方法,其特征在于,所述图像数据识别方法使用如权利要求1至5任一项所述的构建方法构建出的骨架检测模型,所述图像数据识别方法包括:
获取用户的RGB图像和深度图像;
将所述RGB图像和所述深度图像输入所述骨架检测模型,获取第三人体骨架关键点坐标;
其中,所述第三人体骨架关键点坐标为3D骨架关键点坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐歌人体工学科技股份有限公司,未经乐歌人体工学科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211592632.2/1.html,转载请声明来源钻瓜专利网。