[发明专利]基于人体结构多尺度分割的行人属性识别方法、存储介质和终端有效
申请号: | 202110211944.3 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112883880B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 匡平;付蓉 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/26;G06V10/44;G06V10/52;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 张巨箭 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人体 结构 尺度 分割 行人 属性 识别 方法 存储 介质 终端 | ||
本发明公开了基于人体结构多尺度分割的行人属性识别方法、存储介质和终端,方法包括以下步骤:得到输入的行人图像;获取行人图像的细节关键点和抽象人体区域;对行人图像的特征进行逐层提取;将提取的细节关键点与浅层特征进行结合,并将提取的抽象人体区域与深层特征进行结合,将结合后的数据和深层特征分别输入到区域引导模块得到多个预测向量;将多个预测向量进行融合,得到最终预测结果。本发明由于网络的深浅‑人体结构的粗细划分‑属性的高低级之间存在着对应的关系,因此在更浅的特征层上对更细的行人局部做特征学习,在更高的特征层上对划分更粗的行人局部进行特征学习,利用身体结构去指导行人属性识别,从而得到强大的行人属性表示。
技术领域
本发明涉及行人属性识别领域,尤其涉及基于人体结构多尺度分割的行人属性识别方法、存储介质和终端。
背景技术
行人属性识别(Pedestrian Attribute Recognition,PAR)从本质上而言,是属于目标检测范畴,即从图像或视频序列中提取描述场景中个体的人类可理解特征的语义特征。由于它们提供了关于人类的重要信息,这些系统已经被集成到许多现实世界的应用中,并与世界各地的许多技术相结合。
由于不同的行人属性往往对应人体不同的位置,导致对应的特征提取比困难。例如发型和颜色,帽子等属性被看作是特定的低级属性,往往对应于图像的不同小区域;而一些属性是抽象的概念,如性别、取向和年龄,它们不对应于某些区域,这些属性被认为是高级属性。为了解决上述问题,现有的方法一部分倾向与寻找人体局部与属性之间的关联,这便导致PAR的准确率往往和人体部件分割的准确性有着较大关联。还有一部分倾向于寻找不同的语义层次与不同属性之间的关联,但很难找到一个更准确具体的描述各个属性与语义之间关系的模型。由于低级属性对应更小的人体局部区域,更小区域也更适合使用低层次的网络来寻找,高级属性反之,先前的方法都没有考虑到这种有关“属性等级-人体区域”之间的共同联系。
发明内容
本发明的目的在于克服现有技术的不足,提供基于人体结构多尺度分割的行人属性识别方法、存储介质和终端。
本发明的目的是通过以下技术方案来实现的:
本发明的第一方面,提供基于人体结构多尺度分割的行人属性识别方法,包括以下步骤:
得到输入的行人图像;
获取行人图像的细节关键点和抽象人体区域;
对行人图像的特征进行逐层提取;
将提取的细节关键点与浅层特征进行结合,并将提取的抽象人体区域与深层特征进行结合,将结合后的数据和深层特征分别输入到区域引导模块得到多个预测向量;
将多个预测向量进行融合,得到最终预测结果。
进一步地,所述获取行人图像的细节关键点和抽象人体区域包括:
利用行人姿态估计模型分别获得所述行人图像的先验人体姿态关键点P1、多个人体部位区域P2、行人区域P3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110211944.3/2.html,转载请声明来源钻瓜专利网。