[发明专利]一种人体姿态估计方法、装置在审
申请号: | 201911336949.8 | 申请日: | 2019-12-23 |
公开(公告)号: | CN113095106A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 谭文伟 | 申请(专利权)人: | 华为数字技术(苏州)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/73;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 望紫薇 |
地址: | 215123 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人体 姿态 估计 方法 装置 | ||
1.一种人体姿态估计方法,其特征在于,包括:
将待处理图像输入预先训练的神经网络模型,其中,所述待处理图像中包括人体,所述神经网络模型包括非局部网络模块和至少一级高分辨率网络模块;
基于所述非局部网络模块提取所述待处理图像的特征信息,生成所述待处理图像的特征图,所述特征信息包括所述人体所在区域的每个像素与所述人体所在区域的其他像素的相关信息;
基于所述至少一级高分辨率网络模块对所述特征图进行计算,获得所述待处理图像中所述人体的姿态估计结果。
2.如权利要求1所述的方法,其特征在于,所述神经网络模型还包括至少一个m×m卷积模块,m为奇数;所述非局部网络模块设置在所述至少一个卷积模块之后,所述至少一级高分辨率网络模块之前;
在基于所述非局部网络模块提取所述待处理图像的特征信息之前,还包括:
基于所述至少一个卷积模块对所述待处理图像中所述人体所在区域上的若干个m×m大小的区域进行初步特征提取,获得所述待处理图像的初始特征信息,并基于所述初始特征信息生成所述待处理图像的初始特征图;
基于所述非局部网络模块提取所述待处理图像的特征信息,包括:
将所述初始特征图输入所述非局部网络模块,计算所述待处理图像中所述人体所在区域的每个像素与所述人体所在区域的其他像素的相关信息,基于所述初始特征信息以及所述相关信息生成所述待处理图像的特征图。
3.如权利要求2所述的方法,其特征在于,所述初始特征信息包括像素值、颜色特征、纹理特征、形状特征或空间关系特征中的一项或多项;
所述相关信息包括空间关系、颜色关系、纹理关系或形状关系中的一项或多项。
4.如权利要求2所述的方法,其特征在于,所述非局部网络模块计算所述待处理图像中所述人体所在区域的每个像素与所述人体所在区域的其他像素的相关信息,具体包括:
按照如下公式计算所述待处理图像中所述人体所在区域的每个像素与所述人体所在区域的其他像素的相关信息:
zi=Wzyi+xi (2)
其中,f为配对计算函数,用于计算像素Xi和像素Xj的相关信息;yi为所述人体所在区域上像素Xj与所述人体所在区域上的所有其他像素的相关信息;g(xj)为一元输入函数,用于变换不同的像素Xj;C(x)为归一化函数,保证变换yi前后整体信息不变,x为输入的所述人体所在区域的图像;j为所述人体所在区域上的其他像素的标识;
zi为non-local网络模块输出的特征图;Wz为权重值;+xi表示一个残差连接。
5.如权利要求1-4任一项所述的方法,其特征在于,所述高分辨率网络模块包括多个交换模块,所述高分辨率网络模块中的每个交换模块包括至少两个并联连接的残差块,所述每个交换模块中第n个残差块的分辨率为c/An-1,所述第n个残差块的输出通道为C0×Bn-1,其中c等于所述非局部网络模块的分辨率大小,n为正整数,A、B为大于1的正整数,C0为所述非局部网络模块的输出通道数。
6.如权利要求5所述的方法,其特征在于,所述高分辨率网络模块还包括多个交换单元,所述交换单元和所述交换模块按照预定次序交替连接,所述交换单元用于对输入的特征图进行多尺度融合。
7.如权利要求5所述的方法,其特征在于,所述残差块由多个相同类型的残差单元串联而成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为数字技术(苏州)有限公司,未经华为数字技术(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911336949.8/1.html,转载请声明来源钻瓜专利网。