[发明专利]一种基于迁移学习的行人重识别方法在审
申请号: | 201711112527.3 | 申请日: | 2017-11-13 |
公开(公告)号: | CN107832711A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 王洪元;王冲;丁宗元 | 申请(专利权)人: | 常州大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 213164 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 行人 识别 方法 | ||
技术领域
本发明涉及一种基于迁移学习的行人重识别方法,属于计算机视觉技术领域。
背景技术
随着城市化发展的步伐,人们对公共安全越来越重视,许多重要的公共场所都安装了大量的监控摄像头,为寻找犯罪分子的踪迹提供了便利,因此,行人重识别技术得到了广泛的关注。行人重识别技术指从不同摄像机,不同时间段的行人图像数据集中找出与要检索的行人相匹配的图像。在行人重识别系统中,一个很重要的技术问题就是在一个新的场景下的部署性和适应性。然而,在实际应用场景中,由于在新场景中用于训练的标签信息很匮乏,而且很难获得,使得已有的训练样本不足以训练得到一个可靠的模型。另一方面,要标记目标领域的数据也是相当困难,即使是少量的,也要消耗很大的人力物力。这就引起了机器学习中关注的一个重要问题,如何利用少量的有标签训练样本或者源领域数据,建立一个可靠的模型对目标领域数据进行预测。
近年来,迁移学习已经引起了广泛的关注和研究,其运用已知存在的知识对不同但相关领域问题进行求解的一种新的机器学习方法,它放宽了传统机器学习中的两个基本假设:(1)用于学习的训练样本与新的测试样本满足独立同分布的条件。(2)必须有足够可利用的训练样本才能学习得到一个好的分类模型。目的是迁移已有的知识解决目标领域中仅有少量有标签样本数据甚至没有的学习问题。迁移学习的关键是寻找源域与目标域之间的“共同点”,从而实现知识的迁移。现有技术中,提出将不同问题领域中的特征分为领域相关特征和领域独立特征,通过领域相关特征建立领域间联系实现知识的迁移,再基于谱图划分对数据进行分类;还提出了一种方法,即估计源领域中的每个样本与目标领域中少量标签数据之间的不匹配程度,并把该信息应用到逻辑回归中。另外,提出了基于同步聚类的分类方法,该方法通过对类别和特征进行同步聚类,实现类别标签的迁移。还提出了一种桥接精化的迁移学习方法,该方法在精化的过程中不断地修正由源领域训练得到的模型在测试数据集上的预测类别,从而获得较高的预测准确率。
自学习也是一种利用大量无标签数据来提高给定分类聚类任务性能的方法,自学习被应用于迁移学习中,因为它不要求无标签数据的分布与目标领域中的数据分布相同。纵观基于迁移学习分类算法,尽管其取得了一定效果,但也存在不足之处:1)共同特征表示是在源域和目标域中提取,存在类别比例漂移问题;2)由于标签信息主要来自源域数据,因此使得学习到的模型容易过拟合或对目标领域不可靠。
发明内容
目的:为了克服现有技术中存在的不足,本发明提供一种基于迁移学习的行人重识别方法。
技术方案:为解决上述技术问题,本发明采用的技术方案为:
一种基于迁移学习的行人重识别方法,包括如下步骤:
步骤1,对数据集中原始图片运用多尺度Retinex彩色图像增强算法预处理,去除光照带来的影响;
步骤2,对预处理后的数据集提取行人的相关特征作为行人的原始特征;
步骤3,初始模型建立——非对称多任务判别模型;
步骤4,运用目标领域部分无标签数据的流形结构对初始模型进行精化;
步骤5,运用共轭梯度法对目标函数进行优化,得到最终分类器;
步骤6,在行人重识别标准数据库中对分类器进行行人重识别,并用CMC曲线来表示重识别测试的效果。
作为优选方案,所述原始图像经多尺度Retinex彩色图像增强算法预处理:
I(x,y)=L(x,y)*R(x,y)(1)
式中,I(x,y)代表原始图像,L(x,y)代表在环境光的照射分量;R(x,y)表示携带图像细节信息的目标物体的反射分量;针对一幅原始图像I(x,y),通过Retinex算法计算出对应的R(x,y),则R(x,y)是增强后的图像;处理后的图像大大缓解光照的影响,使图像更接近原色。
作为优选方案,所述步骤2包括如下步骤:
2.1:每一幅行人图片的像素被统一成128×48的大小,对图像分别取像素大小为16×16的重叠区域;
2.2:在垂直和水平方向每次移动间隔8个像素,重叠率为50%;
2.3:对于每一个16x16大小的区域块,颜色特征是通过连接的8个颜色通道,包括:RGB,YCbCr,HS,创建16个bin的直方图;
2.4:分别提取HOG特征和LBP特征,并建立直方图统计特征;
2.5:通过计算,每一个16x16大小的区域块提取color、HOG、LBP三种共484维的特征向量,对于一张行人图片,总共有75块,合计36300维。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711112527.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:虹膜自助注册方法
- 下一篇:活体检测方法、装置和计算机可读存储介质