[发明专利]一种基于视觉词袋模型的行人重识别方法有效
| 申请号: | 201810307805.9 | 申请日: | 2018-04-08 |
| 公开(公告)号: | CN108509925B | 公开(公告)日: | 2020-04-14 |
| 发明(设计)人: | 张云洲;刘一秀;李瑞龙;王松;史维东;孙立波;刘双伟 | 申请(专利权)人: | 东北大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 韩国胜 |
| 地址: | 110169 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 视觉 模型 行人 识别 方法 | ||
本发明公开了一种基于视觉词袋模型的行人重识别方法,方法包括:101、提取每张图像的局部区域的行人特征;102、获取每一个行人特征的字典和稀疏表示向量;103、依据所有行人特征的所述字典、稀疏表示向量,构建每张图像的视觉词袋模型;104、采用每张图像的视觉词袋模型,获取该图像的视觉词袋直方图;105、将任意两张图像的每一个行人特征的稀疏表示向量和视觉词袋模型进行匹配,获取匹配结果,所述任意两张图像中的一张图像为一个摄像机中的图像,另一张图像为另一个摄像机中的图像。上述方法能够解决Office文档在转换过程中文档格式跑版的问题。上述方法能够提高行人重识别的准确率,减少运算量。
技术领域
本发明涉及计算机视觉领域,具体涉及一种基于视觉词袋模型的行人重识别方法。
背景技术
行人重识别(Person Re-identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。其主要任务是给定一个监控行人图像,检索跨设备下的该行人图像。这种算法在智能安防刑侦工作及图像检索等场景中具有很高的应用价值。由于图像拍摄时间、地点不同,同时考虑到光线、角度、姿态的差异性,外加大规模分布式部署的监控系统网络的拓展所带来的行人图像数据库数据量的增大,如何提高行人图像的重识别率以及检索效率仍旧面临很大挑战。以行人数据集规模的过大的问题为例。一方面,随着数据量的变大,摄像机数量的增多,行人身份数据的标注愈发的困难,对算法鲁棒性的要求也越来越高。另一方面,随着数据量的增大,算法运行时间也会变长,这就对算法的效率提出了较高的要求。
因此,在大规模数据集下如何提高行人重识别率,且使得运行时间合适,算法效率高成为当前需要解决的问题。
发明内容
针对现有技术中的问题,本发明提供一种基于视觉词袋模型的行人重识别方法,本发明的方法能够提高行人重识别的准确率,减少运算量。
第一方面,本发明提供一种基于视觉词袋模型的行人重识别方法,包括:
101、提取每张图像的局部区域的行人特征;
102、获取每一个行人特征的字典和稀疏表示向量;
103、依据所有行人特征的所述字典、稀疏表示向量,构建每张图像的视觉词袋模型;
104、采用每张图像的视觉词袋模型,获取该图像的视觉词袋直方图;
105、将任意两张图像的每一个行人特征的稀疏表示向量和视觉词袋模型进行匹配,获取匹配结果,所述任意两张图像中的一张图像为一个摄像机中的图像,另一张图像为另一个摄像机中的图像。
可选地,所述步骤101包括:
采用SIFT特征提取算法和/或LOMO特征提取算法提取每张图像的局部区域的视觉特征描述子。
可选地,所述步骤102包括:
针对每张图像的所有视觉特征描述子,采用跨视角字典学习算法对视觉特征描述子进行处理,获取每一个视觉特征描述子的字典和稀疏表示向量。
可选地,所述步骤103包括:
利用K均值聚类算法,将字典中的特征向量进行聚类,得到了一组相关性小于预设阈值的特征向量;
基于聚类后的特征向量构成视觉词袋模型。
可选地,所述步骤105包括:
利用余弦距离和/或XQDA度量学习算法对图像中提取的特征描述子进行距离的度量;
余弦距离定义如下:
其中,Xi、Yi为两张图像的特征向量在第i个维度的值,n为自然数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810307805.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人体姿态的评分方法和装置
- 下一篇:一种基于双向颜色空间变换的建筑物提取方法





