[发明专利]行人再识别模型的训练方法、行人再识别方法及装置在审
申请号: | 202110800485.2 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113537055A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 王言伟;鄂小松;王锋;刘晨哲;张恒;蒋宏斌 | 申请(专利权)人: | 浙江富衍信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京科领智诚知识产权代理事务所(普通合伙) 11782 | 代理人: | 陈士骞 |
地址: | 310003 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 识别 模型 训练 方法 装置 | ||
本发明实施例公开一种行人再识别模型的训练方法、行人再识别方法及装置,涉及计算机视觉领域,能够解决现有行人再识别模型识别准确率较低的问题。该方法包括:获取训练样本中行人图像的行人姿态信息和行人特征向量;行人姿态信息包括由头部关键点和/或肩部关键点确定的信息;将行人姿态信息嵌入行人特征向量后获得的目标向量,输入神经网络进行行人再识别模型训练;从训练样本中获取三元组样本;基于三元组样本中每个行人图像的行人特征向量、行人姿态信息和图像宽度,计算三元组损失值;根据三元组损失值调整行人再识别模型的参数,直至三元组损失值满足收敛条件时,所对应的模型为目标行人再识别模型。
技术领域
本发明涉及计算机视觉领域,具体而言,涉及一种行人再识别模型的训练方法、行人再识别方法及装置。
背景技术
行人重识别,也称行人再识别,是计算机视觉领域近些年来一个非常热门的研究课题,可以被视为一个图像检索的子问题,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,即行人再识别能够通过图像或视频进行分析,判断出待测行人是否为目标行人。
相关技术中,行人重识别主要集中在对衣服颜色、衣服样式等行人外表特征的分析上,但实际应用中,这些外表特征很容易受到行人姿态因素的影响(例如同一行人在不同姿态情况下,衣服样式可能会被识别成不同样式,或者不同行人在不同姿态情况下,衣服样式被识别成相同样式),进而大大影响行人再识别模型的识别准确率。
发明内容
本发明提供了一种行人再识别模型的训练方法、行人再识别方法及装置,以提高行人再识别的准确率。具体的技术方案如下:
第一方面,本发明实施例提供了一种行人再识别模型的训练方法,所述方法包括:
获取训练样本中行人图像的行人姿态信息和行人特征向量;所述训练样本包括标记有类别标签的行人图像;所述行人姿态信息包括由头部关键点和/或肩部关键点确定的信息;
将所述行人姿态信息嵌入所述行人特征向量后获得的目标向量,输入神经网络进行行人再识别模型训练;
从训练样本中获取三元组样本,所述三元组样本包括第一行人图像、第二行人图像和第三行人图像,所述第一行人图像与所述第二行人图像属于同一类别,所述第一行人图像与所述第三行人图像属于不同类别;
基于所述三元组样本中每个行人图像的行人特征向量、行人姿态信息和图像宽度,计算三元组损失值;
根据所述三元组损失值调整所述行人再识别模型的参数,直至三元组损失值满足收敛条件时,所对应的模型为目标行人再识别模型。
可选的,将所述行人姿态信息嵌入所述行人特征向量后获得的目标向量,输入神经网络进行行人再识别模型训练,包括:
将所述行人图像切分成多个行人图像块;
根据所述肩部关键点和行人倾斜判断基准线确定行人倾斜角度;
根据所述行人图像块的位置信息、所述行人倾斜角度、所述行人特征向量,以及所述头部关键点、所述肩部关键点与所述行人图像块的位置关系,计算所述目标向量;
将所述目标向量输入神经网络进行行人再识别模型训练。
可选的,根据所述行人图像块的位置信息、所述行人倾斜角度、所述行人特征向量,以及所述头部关键点、所述肩部关键点与所述行人图像块的位置关系,计算所述目标向量,包括:
根据如下公式计算每个行人图像块的目标特征:
Ei=λif(impi)+pi+αθ
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江富衍信息科技有限公司,未经浙江富衍信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110800485.2/2.html,转载请声明来源钻瓜专利网。