[发明专利]基于Inception V3的多数据集联合训练的行人外观属性识别方法在审
| 申请号: | 201910089320.1 | 申请日: | 2019-01-30 |
| 公开(公告)号: | CN109886154A | 公开(公告)日: | 2019-06-14 |
| 发明(设计)人: | 李耶;殷光强;石方炎;候少麒;殷雪朦 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06T3/40;G06T3/60;G06T5/00 |
| 代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 廖曾;贺立中 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 外观属性 数据集 预处理 图像 卷积神经网络 目标监控场景 目标姿态变化 数据集数据 监控场景 监控视频 目标场景 实际场景 损失函数 因素影响 构建 遮挡 光照 联合 改进 学习 | ||
1.基于Inception V3的多数据集联合训练的行人外观属性识别方法,其特征在于:包括以下步骤:
1)获取含有行人的监控视频片段,对行人图像进行预处理;
2)构建新的Inception V3卷积神经网络模型;
3)改进logistic loss损失函数;
4)输入多个公开数据集数据,进行训练,得到行人外观属性识别模型;
5)利用所得行人外观属性识别模型进行实际场景下的识别。
2.根据权利要求1所述的基于Inception V3的多数据集联合训练的行人外观属性识别方法,其特征在于:所述步骤1)包括以下具体步骤:
1.1)将截取的视频帧按照规定的图片命名方式进行命名,保存到指定位置;
1.2)对所有的图片文件进行外观属性标注,形成数据集;
1.3)将数据集分成两部分,分别为训练集、验证集,训练集用于训练模型,验证集用于测试模型效果,不参与训练,其中,训练集占总图片数量的70~90%,测试集占总图片数量的10~30%。
3.根据权利要求1所述的基于Inception V3的多数据集联合训练的行人外观属性识别方法,其特征在于:所述新的Inception V3卷积神经网络模型包括5个卷积层、11个block结构及4个并列的全连接层;所述卷积层和block结构用于自动提取行人属性特征;全连接层用于组合属性特征,获取对应属性分数。
4.根据权利要求1所述的基于Inception V3的多数据集联合训练的行人外观属性识别方法,其特征在于:所述步骤3)具体为:将每个全连接层后皆加一个loss函数,最后计算所有loss之和,来进行多数据集联合训练。
5.根据权利要求4所述的基于Inception V3的多数据集联合训练的行人外观属性识别方法,其特征在于:所述loss函数为:
其中N表示训练时每次送入的图片数量,C为行人对应的外观属性数量,每个行人图片表示为xn,对应经过网络计算的输出为Vn,对应的标签向量为yn,每个标签向量对应的属性值为yn,i,i∈[1,2,...,C],如果yn,i=1表明这个训练样本xn有这个属性,如果yn,i=0表明这个训练样本xn没有这个属性;Sn,i表示这个样本xn的第i个属性的得分高低,Sn,i∈[0,1],yn,i是真实属性标签,表示行人样本xn有没有第i个属性。
6.根据权利要求1所述的基于Inception V3的多数据集联合训练的行人外观属性识别方法,其特征在于:所述步骤4)包括以下具体步骤:
4.1)训练之前,准备大于6G显存的GPU和linux系统环境,搭建pytorch环境;
4.2)设置模型训练的优化方式;
4.3)设置模型训练的图片预处理方式;
4.4)设置模型的基础学习率、动量权重以及最大迭代次数,在最大迭代次数下,不断迭代学习,直到损失函数值不再下降,模型收敛,保存模型参数;
4.5)完成训练,得到行人外观属性识别模型。
7.根据权利要求6所述的基于Inception V3的多数据集联合训练的行人外观属性识别方法,其特征在于:所述步骤4.3)包括以下具体步骤:
4.3.1)改变图片的亮度、对比度和饱和度;
4.3.2)经过步骤4.3.1)后,将图片进行随机的水平翻转;
4.3.3)经步骤4.3.2)后,将图片最短边缩放到150像素,长边按照1:3的比例缩放到450像素;
4.3.4)经步骤4.3.3)后,缩放的图片不进行裁剪,直接送入网络进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910089320.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





