[发明专利]目标对象的属性识别方法及装置有效
申请号: | 201710983033.6 | 申请日: | 2017-10-19 |
公开(公告)号: | CN107704838B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 肖琦琦;张弛 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 宋南 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 对象 属性 识别 方法 装置 | ||
本发明提供了一种目标对象的属性识别方法及装置,涉及图像识别技术领域,该方法采用识别网络执行,该识别网络包括特征提取网络,以及分别与特征提取网络相连的行人再识别网络、行人姿态识别网络和行人属性识别网络;识别网络的参数由行人再识别网络、行人姿态识别网络和行人属性识别网络基于共享特征提取网络的方式联合训练得到;该方法包括:特征提取网络提取目标对象的特征信息;行人属性识别网络基于该特征信息,确定目标对象的属性。本发明可以使行人属性识别网络通过与行人再识别网络、行人姿态识别网络共享特征提取网络的方式而获取到更为丰富全面的特征信息,从而有效提升了属性识别的准确性和鲁棒性。
技术领域
本发明涉及图像识别技术领域,尤其是涉及一种目标对象的属性识别方法及装置。
背景技术
行人属性识别技术能够识别出图片中行人的属性信息;其中,行人的属性信息可以包括性别、年龄、衣服颜色、是否背包等。行人属性识别技术通常采用的方法是:用SVM(support vector machine,支撑向量机)或者卷积神经网络训练若干二分类分类器来判断当前的目标是否有某个属性,或者确定一共需要判断哪些属性后,训练一个多分类分类器来判断这些属性。然而,发明人在研究过程中发现,利用上述常规方法进行的行人属性识别的过程中,容易受诸如人体姿态变化、人体部分遮挡等不利于属性识别的因素干扰,鲁棒性较差;此外,还存在数据缺乏等问题,都会导致行人属性识别的准确性较低。
发明内容
有鉴于此,本发明的目的在于提供一种目标对象的属性识别方法及装置,能够提升行人属性识别的准确性和鲁棒性。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种目标对象的属性识别方法,所述方法采用识别网络执行,所述识别网络包括特征提取网络,以及分别与所述特征提取网络相连的行人再识别网络、行人姿态识别网络和行人属性识别网络;所述识别网络的参数由所述行人再识别网络、所述行人姿态识别网络和所述行人属性识别网络基于共享所述特征提取网络的方式联合训练得到;所述方法包括:所述特征提取网络提取所述目标对象的特征信息;所述行人属性识别网络基于所述特征信息,确定所述目标对象的属性。
进一步,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述方法还包括:基于共享特征提取网络的方式对所述行人再识别网络、所述行人姿态识别网络和所述行人属性识别网络联合训练,直至所述识别网络的总损失函数值收敛至预设值,将所述总损失函数值收敛至预设值时对应的参数作为识别网络的参数。
进一步,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述基于共享所述特征提取网络的方式对所述行人再识别网络、所述行人姿态识别网络和所述行人属性识别网络联合训练的步骤包括:将训练图片输入至所述特征提取网络,以使所述特征提取网络生成所述训练图片的特征图;将所述特征图输入至所述行人再识别网络,计算得到第一损失函数值;将所述特征图输入至所述行人姿态识别网络,计算得到第二损失函数值;将所述特征图输入至所述行人属性识别网络,计算得到第三损失函数值;根据所述第一损失函数值、所述第二损失函数值和所述第三损失函数值,确定总损失函数值;基于所述总损失函数值,通过反向传播算法对所述识别网络的参数进行训练。
进一步,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述将训练图片输入至所述特征提取网络的步骤,包括:从含有行人身份标签的第一数据集挑选三张图片,从含有行人骨架标签的第二数据集挑选一张图片,以及从含有行人属性标签的第三数据集挑选一张图片,将挑选的图片作为训练图片;其中,从所述第一数据集挑选的三张图片分别为参考图片、正样本图片和负样本图片。
进一步,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述将所述特征图输入至所述行人再识别网络,计算得到第一损失函数值的步骤,包括:将所述参考图片、所述正样本图片和所述负样本图片分别对应的特征图输入至所述行人再识别网络;通过三元组损失函数计算得到第一损失函数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710983033.6/2.html,转载请声明来源钻瓜专利网。