[发明专利]基于人体结构多尺度分割的行人属性识别方法、存储介质和终端有效
申请号: | 202110211944.3 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112883880B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 匡平;付蓉 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/26;G06V10/44;G06V10/52;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 张巨箭 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人体 结构 尺度 分割 行人 属性 识别 方法 存储 介质 终端 | ||
1.基于人体结构多尺度分割的行人属性识别方法,其特征在于:包括以下步骤:
得到输入的行人图像;
获取行人图像的细节关键点和抽象人体区域,包括利用行人姿态估计模型分别获得所述行人图像的先验人体姿态关键点P1、多个人体部位区域P2、行人区域P3;
对行人图像的特征进行逐层提取,包括利用层次特征提取模块,至少三层对行人图像的特征进行逐层提取,得到特征F1、特征F2、特征F3;所述层次特征提取模块为以Resnet50为基础的主干网,包括顺次连接的五个卷积层conv1、conv2、conv3、conv4和conv5,其中特征F1由卷积层conv2输出,特征F2由conv3输出,特征F3由conv4输出;
将提取的细节关键点与浅层特征进行结合,并将提取的抽象人体区域与深层特征进行结合,将结合后的数据和深层特征分别输入到区域引导模块得到多个预测向量,包括:将先验人体姿态关键点P1和特征F1进行对应,将多个人体部位区域P2和特征F2进行对应,将行人区域P3和特征F3进行对应,对应后分别输入区域引导模块后得到预测向量同时将特征F3输入至输入区域引导模块后得到预测向量
将多个预测向量进行融合,得到最终预测结果。
2.根据权利要求1所述的基于人体结构多尺度分割的行人属性识别方法,其特征在于:所述行人姿态估计模型得到人体姿态关键点坐标K=[k1,k2,…,kM],M为关键点总数;所述先验人体姿态关键点P1=[K1,K2,…,KM],其中K1=[k1]、K2=[k2],以此类推;多个人体部位区域P2=[Khead,Kupper,Klower],其中Khead、Kupper、Klower分别包含表示人体头、上身、下身的关键点坐标;行人区域P3=[Kbody],其中Kbody包含框出整个人体的四个关键点。
3.根据权利要求1所述的基于人体结构多尺度分割的行人属性识别方法,其特征在于:所述区域引导模块具体为:
将Fi和Pi(i=1,2,3)输入区域引导模块,Fi的尺寸为Wi×Hi×Di;
对Pi中每一个Kj,利用空间变换器网络在Fi上进行区域提取,得到尺寸为W′i×H′i×Di的区域特征;
对于三层的每层区域,使用独立的神经网络进行特征学习,使用Di维度的全连接层FC来学习每个区域的特征;
将每个Pi对应的区域学习到的特征融合得到集成特征表示,得到基于M个区域的尺度为M×Di的集成表示;
基于上述集成特征表示,分别使用具有L输出量的FC作为分类器对属性进行分类,预测结果记为L为需要分类的属性个数,对于特征F3也使用具有L输出量的FC作为分类器对属性进行分类,预测结果记为
4.根据权利要求1所述的基于人体结构多尺度分割的行人属性识别方法,其特征在于:所述将多个预测向量进行融合,得到最终预测结果,包括:
利用结果对比模块将预测向量进行融合得到预测结果其中通过选择每一属性的预测结果最大值而得到。
5.一种存储介质,其上存储有计算机指令,其特征在于:所述计算机指令运行时执行权利要求1至4中任一项所述的基于人体结构多尺度分割的行人属性识别方法的步骤。
6.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至4中任一项所述的基于人体结构多尺度分割的行人属性识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110211944.3/1.html,转载请声明来源钻瓜专利网。