[发明专利]一种基于注意力多分辨率网络的人体姿态估计方法及系统在审
申请号: | 202110271084.2 | 申请日: | 2021-03-12 |
公开(公告)号: | CN113011304A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 常发亮;丁锐;李南君;蒋沁宇 | 申请(专利权)人: | 山东大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 分辨率 网络 人体 姿态 估计 方法 系统 | ||
1.一种基于注意力多分辨率网络的人体姿态估计方法,其特征在于,包括:
获取待识别的目标图像;
将待识别的目标图像输入训练好的注意力多分辨率网络模型中,获取姿态估计结果;
其中,注意力多分辨率网络模型包括快速采样阶段、网络主体部分和表征融合模块,快速采样阶段对输入的图像下采样并提取不同分辨率的表征信息,通过网络主体部分从不同分辨率的表征信息中提取分辨率支路特征,表征融合模块使用通道注意力机制,将不同分辨率支路特征加权融合,获得融合特征,通过该融合特征进行姿态估计。
2.如权利要求1所述的基于注意力多分辨率网络的人体姿态估计方法,其特征在于,快速采样阶段使用传统的卷积层和多内容注意力残差单元,对输入的图像下采样并提取不同分辨率的表征信息。
3.如权利要求1所述的基于注意力多分辨率网络的人体姿态估计方法,其特征在于,快速采样阶段使用两个卷积层对输入图像进行下采样,每个卷积层后接批标准化层,批标准化层后连接多内容注意力残差单元,多内容注意力残差单元中包含具有不同感受野和分辨率的分支,以学习不同分辨率的表征信息。
4.如权利要求1所述的基于注意力多分辨率网络的人体姿态估计方法,其特征在于,网络主体部分采用并联结构的主干网络,主干网络采用残差模块。
5.如权利要求1所述的基于注意力多分辨率网络的人体姿态估计方法,其特征在于,使用通道注意力机制进行不同分辨率支路特征加权融合的过程为:通道注意力机制将网络主体部分的各个分辨率支路对齐后的中间特征图作为输入,分别对中间特征图进行平均池化和最大值池化,获得两个不同的空间上下文描述子,将描述子送入多层感知器中,得到两个通道注意力图,将两个通道注意力图进行对应元素相加后使用sigmoid函数激活,得到最终的通道注意力图,将最终的通道注意力图与中间特征图进行对应元素相乘,实现对不同分辨率支路特征的加权,最后使用卷积融合不同分辨率支路特征,获得融合特征。
6.如权利要求1所述的基于注意力多分辨率网络的人体姿态估计方法,其特征在于,注意力多分辨率网络模型的训练过程为:
获取原始图像;
对原始图像进行预处理;
对预处理后图像进行数据增强;
通过数据增强后图像构建训练数据集,对注意力多分辨率网络模型进行训练。
7.如权利要求1所述的基于注意力多分辨率网络的人体姿态估计方法,其特征在于,注意力多分辨率网络模型训练时,使用权重衰减和批标准化避免过拟合,损失函数使用均方误差L2 Loss。
8.一种基于注意力多分辨率网络的人体姿态估计系统,其特征在于,包括:
图像获取模块,用于获取待识别的目标图像;
姿态估计模块,用于将待识别的目标图像输入训练好的注意力多分辨率网络模型中,获取姿态估计结果;
其中,注意力多分辨率网络模型包括快速采样阶段、网络主体部分和表征融合模块,快速采样阶段对输入的图像下采样并提取不同分辨率表征,通过网络主体部分从不同分辨率表征中提取分辨率支路特征,表征融合模块使用通道注意力机制,将不同分辨率支路特征加权融合,获得融合特征,通过该融合特征进行姿态估计。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的一种方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的一种方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110271084.2/1.html,转载请声明来源钻瓜专利网。