[发明专利]基于Inception V3的多数据集联合训练的行人外观属性识别方法在审
| 申请号: | 201910089320.1 | 申请日: | 2019-01-30 |
| 公开(公告)号: | CN109886154A | 公开(公告)日: | 2019-06-14 |
| 发明(设计)人: | 李耶;殷光强;石方炎;候少麒;殷雪朦 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06T3/40;G06T3/60;G06T5/00 |
| 代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 廖曾;贺立中 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 外观属性 数据集 预处理 图像 卷积神经网络 目标监控场景 目标姿态变化 数据集数据 监控场景 监控视频 目标场景 实际场景 损失函数 因素影响 构建 遮挡 光照 联合 改进 学习 | ||
本发明公开了基于Inception V3的多数据集联合训练的行人外观属性识别方法,解决现有基于深度学习的行人外观属性识别方法在监控场景下易受光照、遮挡、目标姿态变化和图像清晰度等因素影响,泛化能力较差的问题,能够实现目标监控场景下的行人属性准确识别,并且只需要极少的目标场景数据即可实现,包括以下步骤:1)获取含有行人的监控视频片段,对行人图像进行预处理;2)构建新的Inception V3卷积神经网络模型;3)改进logistic loss损失函数;4)输入多个公开数据集数据,进行训练,得到行人外观属性识别模型;5)利用所得行人外观属性识别模型进行实际场景下的识别。
技术领域
本发明涉及模式识别技术、智能监控技术等领域,具体的说,是基于Inception V3的多数据集联合训练的行人外观属性识别方法。
背景技术
近年来,视频监控系统已经被广泛应用于安防领域。安防人员通过合理的摄像头布局,实现对目标监控场景的全覆盖,通过全天候对目标区域的监控,能够有效控制犯罪活动,来保证公众的人身安全。计算机技术的飞速发展,大大促进了视频监控系统智能化,提高了获取视频信息的效率。人体相关信息是监控场景下应该重点关注的信息。通过对监控场景下人流流量的统计分析,可以对公共安全技术情况进行合理的预测,从而有效防止意外事故的发生。随着计算机视觉技术的进一步发展,人们迫切希望对检测到的人体提取更多有用的信息,例如性别特征、年龄特征、外观特征等,这些人体相关的特征具有广泛的应用。在安防领域,利用性别特征、年龄特征、外观特征等可以快速锁定特定人群,定位目标位置,从而可以进一步进行实现目标检索或者行人重识别等功能。
当前对人体外观属性的识别主要分为两大领域,分别是基于人脸图像的属性识别和基于全身图像的属性识别。
人脸识别最典型的特征脸算法,是通过使用K-L变换进行人脸识别。在将年龄估计作为分类模式的研究中,Dehshibi等人提取人脸图像的纹理特征和面部形状特征,基于人工神经网络进行训练,从而实现对人脸图像进行年龄段的分类。Gao等人把年龄段分为婴儿、小孩、成年、老年,然后通过Gabor滤波器提取人脸图像特征,结合SVM分类器进行年龄属性识别。Takimoto等人使用BP神经网络,他们使用三层的BP神经网络进行训练和分类,除了提取形状和纹理特征外,Takimoto等人还加入了颜色特征,进一步提高了性别分类的准确性。
使用面部图像进行人体外观属性的识别已经具有极高的识别精度,然而在监控场景下,清晰人脸的图像很难获取。因此,基于面部图像的属性识别算法并不适用于真实的监控场景下。近年来,已经有许多科研人员开始关注使用视频监控中的全身图像进行人体外观属性的识别,并且取得了重大的进展。
传统的基于人体的属性识别的研究主要基于预先设计(手工设计)的特征提取器,提取特征向量例如HOG、BIF等,这种方法的局限在于,手工设计特征的过程比较复杂,并且特征的表达能力不足,造成准确率低下。
随着深度学习的不断发展,研究人员开始尝试使用卷积神经网络的方法提取深度特征作为表征人体外观属性的特征,并且取得了突破性的进展。公开号为CN107862300A的专利公开了“一种基于卷积神经网络的监控场景下行人属性识别方法”,但所使用的卷积神经网络比较简单,难以应对行人外观属性识别这类复杂的识别任务,另外由于公开的行人外观数据集都比较小,难以在单个数据集上充分训练行人外观属性识别卷积神经网络。
发明内容
本发明的目的在于提供基于Inception V3的多数据集联合训练的行人外观属性识别方法,解决现有基于深度学习的行人外观属性识别方法在监控场景下易受光照、遮挡、目标姿态变化和图像清晰度等因素影响,泛化能力较差的问题,能够实现目标监控场景下的行人属性准确识别,并且只需要极少的目标场景数据即可实现。
本发明通过下述技术方案实现:基于Inception V3的多数据集联合训练的行人外观属性识别方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910089320.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





