[发明专利]一种移动端实时人体姿态估计方法及系统在审
| 申请号: | 202211015809.2 | 申请日: | 2022-08-24 |
| 公开(公告)号: | CN115359514A | 公开(公告)日: | 2022-11-18 |
| 发明(设计)人: | 李翔;黄玉阔;韩潼瑜 | 申请(专利权)人: | 功夫链(上海)体育文化发展有限公司 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/44;G06V10/42;G06V10/82;G06N3/04 |
| 代理公司: | 大连大工智讯专利代理事务所(特殊普通合伙) 21244 | 代理人: | 梁左秋 |
| 地址: | 200040 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 移动 实时 人体 姿态 估计 方法 系统 | ||
1.一种移动端实时人体姿态估计方法,其特征在于,包括以下过程:
步骤100,利用图像采集设备采集检测图片;
步骤200,将检测图片输入姿态识别模型的主干网络中,进行特征提取,得到特征图;其中,所述姿态识别模型,包括:主干网络、多个反转置卷积层和一个卷积层;所述主干网络采用MobileViT网络;
步骤300,将主干网络输出的特征图,依次输入多个反转置卷积层和一个卷积层,得到人体关键点的热力图;
步骤400,根据热力图,预测出最终的人体关键点信息,实现人体姿态估计。
2.根据权利要求1所述的移动端实时人体姿态估计方法,其特征在于,所述MobileViT网络,包括:依次设置的3*3卷积模块、Mobilenetv2模块、Mobilenetv2模块、Mobilenetv2模块、Mobilenetv2模块、Mobilenetv2模块、MobileViT Block模块、Mobilenetv2模块、MobileViT Block模块、Mobilenetv2模块、MobileViT Block模块。
3.根据权利要求2所述的移动端实时人体姿态估计方法,其特征在于,所述3*3卷积模块采用降采样2倍,第二个、第五个、第六个和第七个Mobilenetv2模块均采用降采样2倍。
4.根据权利要求3所述的移动端实时人体姿态估计方法,其特征在于,所述MobileViTBlock模块里包含Transformer Encoder模块。
5.根据权利要求4所述的移动端实时人体姿态估计方法,其特征在于,所述Transformer Encoder模块具有自注意力机制;
Transformer Encoder模块内部经过多头注意力机制后,输出的特征向量经过二个全连接层,然后进行层归一化操作。
6.根据权利要求1或5所述的移动端实时人体姿态估计方法,其特征在于,所述反转置卷积层的数量是三个,所述卷积层是1*1卷积层。
7.一种移动端实时人体姿态估计系统,其特征在于,包括:采集模块、特征提取模块、反转置卷积处理模块和输出模块;
所述采集模块,用于利用图像采集设备采集检测图片;
所述特征提取模块,用于将检测图片输入姿态识别模型的主干网络中,进行特征提取,得到特征图;其中,所述姿态识别模型,包括:主干网络、多个反转置卷积层和一个卷积层;所述主干网络采用MobileViT网络;
所述反转置卷积处理模块,用于将主干网络输出的特征图,依次输入多个反转置卷积层和一个卷积层,得到人体关键点的热力图;
所述输出模块,用于根据热力图,预测出最终的人体关键点信息,实现人体姿态估计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于功夫链(上海)体育文化发展有限公司,未经功夫链(上海)体育文化发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211015809.2/1.html,转载请声明来源钻瓜专利网。





