[发明专利]基于Inception V3的多数据集联合训练的行人外观属性识别方法在审

申请号：	201910089320.1	申请日：	2019-01-30
公开（公告）号：	CN109886154A	公开（公告）日：	2019-06-14
发明（设计）人：	李耶;殷光强;石方炎;候少麒;殷雪朦	申请（专利权）人：	电子科技大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06T3/40;G06T3/60;G06T5/00
代理公司：	成都其高专利代理事务所(特殊普通合伙) 51244	代理人：	廖曾;贺立中
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	外观属性数据集预处理图像卷积神经网络目标监控场景目标姿态变化数据集数据监控场景监控视频目标场景实际场景损失函数因素影响构建遮挡光照联合改进学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了基于Inception V3的多数据集联合训练的行人外观属性识别方法，解决现有基于深度学习的行人外观属性识别方法在监控场景下易受光照、遮挡、目标姿态变化和图像清晰度等因素影响，泛化能力较差的问题，能够实现目标监控场景下的行人属性准确识别，并且只需要极少的目标场景数据即可实现，包括以下步骤：1）获取含有行人的监控视频片段，对行人图像进行预处理；2）构建新的Inception V3卷积神经网络模型；3）改进logistic loss损失函数；4）输入多个公开数据集数据，进行训练，得到行人外观属性识别模型；5）利用所得行人外观属性识别模型进行实际场景下的识别。

技术领域

本发明涉及模式识别技术、智能监控技术等领域，具体的说，是基于Inception V3的多数据集联合训练的行人外观属性识别方法。

背景技术

近年来，视频监控系统已经被广泛应用于安防领域。安防人员通过合理的摄像头布局，实现对目标监控场景的全覆盖，通过全天候对目标区域的监控，能够有效控制犯罪活动，来保证公众的人身安全。计算机技术的飞速发展，大大促进了视频监控系统智能化，提高了获取视频信息的效率。人体相关信息是监控场景下应该重点关注的信息。通过对监控场景下人流流量的统计分析，可以对公共安全技术情况进行合理的预测，从而有效防止意外事故的发生。随着计算机视觉技术的进一步发展，人们迫切希望对检测到的人体提取更多有用的信息，例如性别特征、年龄特征、外观特征等，这些人体相关的特征具有广泛的应用。在安防领域，利用性别特征、年龄特征、外观特征等可以快速锁定特定人群，定位目标位置，从而可以进一步进行实现目标检索或者行人重识别等功能。

当前对人体外观属性的识别主要分为两大领域，分别是基于人脸图像的属性识别和基于全身图像的属性识别。

人脸识别最典型的特征脸算法，是通过使用K-L变换进行人脸识别。在将年龄估计作为分类模式的研究中，Dehshibi等人提取人脸图像的纹理特征和面部形状特征，基于人工神经网络进行训练，从而实现对人脸图像进行年龄段的分类。Gao等人把年龄段分为婴儿、小孩、成年、老年，然后通过Gabor滤波器提取人脸图像特征，结合SVM分类器进行年龄属性识别。Takimoto等人使用BP神经网络，他们使用三层的BP神经网络进行训练和分类，除了提取形状和纹理特征外，Takimoto等人还加入了颜色特征，进一步提高了性别分类的准确性。

使用面部图像进行人体外观属性的识别已经具有极高的识别精度，然而在监控场景下，清晰人脸的图像很难获取。因此，基于面部图像的属性识别算法并不适用于真实的监控场景下。近年来，已经有许多科研人员开始关注使用视频监控中的全身图像进行人体外观属性的识别，并且取得了重大的进展。

传统的基于人体的属性识别的研究主要基于预先设计(手工设计)的特征提取器，提取特征向量例如HOG、BIF等，这种方法的局限在于，手工设计特征的过程比较复杂，并且特征的表达能力不足，造成准确率低下。

随着深度学习的不断发展，研究人员开始尝试使用卷积神经网络的方法提取深度特征作为表征人体外观属性的特征，并且取得了突破性的进展。公开号为CN107862300A的专利公开了“一种基于卷积神经网络的监控场景下行人属性识别方法”，但所使用的卷积神经网络比较简单，难以应对行人外观属性识别这类复杂的识别任务，另外由于公开的行人外观数据集都比较小，难以在单个数据集上充分训练行人外观属性识别卷积神经网络。

发明内容

本发明的目的在于提供基于Inception V3的多数据集联合训练的行人外观属性识别方法，解决现有基于深度学习的行人外观属性识别方法在监控场景下易受光照、遮挡、目标姿态变化和图像清晰度等因素影响，泛化能力较差的问题，能够实现目标监控场景下的行人属性准确识别，并且只需要极少的目标场景数据即可实现。

本发明通过下述技术方案实现：基于Inception V3的多数据集联合训练的行人外观属性识别方法，包括以下步骤：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910089320.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于多传感器协作的无人驾驶路径选择方法
下一篇：基于深度学习的单株水稻检测定位方法、系统、设备及介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Inception V3的多数据集联合训练的行人外观属性识别方法在审

专利文献下载