[发明专利]一种基于深度学习的改进损失函数的步态识别方法在审
申请号: | 202010696163.3 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111985332A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 胡海根;汪鹏飞;吴泽成;周乾伟;李小薪;钱汉望 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 改进 损失 函数 步态 识别 方法 | ||
一种基于深度学习的改进损失函数的步态识别方法,包括以下步骤:步骤1、获取行人步态数据集;步骤2、对步骤1得到的训练数据进行预处理,利用中心线原则将数据切割成64*64;步骤3、搭建深度卷积神经网络;步骤4、设计损失函数;步骤5、初始化神经网络参数;步骤6、训练搭建好的神经网络,将步骤2得到的训练样本作为输入,对应的实际身份标签作为输出,成批次地输入到网络中,计算损失后,通过反向传播算法,调整网络参数和损失函数的权重;步骤7、使用训练好的网络对未知数据进行识别,分为注册与识别两个阶段。通过本发明的方法能够更好的保留时间和空间维度上的运动信息,在背包、穿大衣等复杂场景下达到更好的识别效果。
技术领域
本发明属于计算机视觉技术领域,涉及一种基于深度学习的改进损失函数的步态识别方法。
技术背景
步态识别通过人们走路的姿势进行身份识别,与其它的生物特征识别技术相比,步态识别具有非接触、远距离和不容易伪装等优点,在预防犯罪、法医鉴定和社会保障方面具有广泛的应用。
目前步态识别主要分为看作图像和看作视频序列两大类方法。前者将所有的步态轮廓图压缩成一副图像,将步态识别看成一个图像匹配问题,很显然这种方法忽视了步态中的时间维度上的信息,也无法建模精细的空间维度的信息;后者从轮廓中提取特征,使用LSTM、3D-CNN或者双流法,可以很好地建模步态识别中时间、空间维度的信息,但其计算代价高昂也不易于训练。目前步态识别方法基本都是在去背景的二值化图上面进行,准确率受目标自身的穿着、打扮与摄像头的角度等因素的影响。
发明内容
为了克服现有技术的不足,在易于训练的同时不丢失时间、空间维度的信息,同时能提高在目标穿大衣、背包等复杂场景下的准确率,本发明提供一种基于深度学习的改进损失函数的步态识别方法,将步态图像看成图像集合,并对损失函数进行改进。
为了解决上述技术问题,本发明能够提供如下的技术方案:
一种基于深度学习的改进损失函数的步态识别方法,所述方法包括以下步骤:
步骤1.使用步态识别数据集或者自行建立数据集,所述步态识别数据集为CASIA-B或OU-MVLP,并对数据集进行预处理,过程如下:
1.1)若使用图像采集设备采集行人的步态图像,对采集到的图像使用deeplabv3+提取人体目标轮廓,转换成二值化图像;
1.2)利用中心线原则将图像切割成64*64;
1.3)将数据集分为训练集和测试集;
步骤2.训练阶段,即在训练集上训练深度卷积神经网络,过程如下:
2.1)搭建深度卷积神经网络,CNN模块提取图像的帧级特征,SP模块从帧级特征中提取序列级特征,MGP模块用于提取不同级别的序列信息,HPM用于同时提取局部和全局特征;
2.2)设计损失函数,定义损失函数如下:
其中,an表示原样本,po表示与an同一类别的样本,ne表示与an不同类别的样本,d(x,y)表示x和y在embedding空间上的欧式距离,margin为正整数用于扩大不同标签样本之间的距离,N表示一个batch中样本的数量,M表示类别的数量,P表示一个batch中的人数,K表示一个batch中每个人图片的数量,P(X)表示样本真实的分布,Q(X)表示网络预测的分布,LBCE和LBF为改进的损失函数;
2.3)将损失函数的权重σ1和σ2作为网络的参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010696163.3/2.html,转载请声明来源钻瓜专利网。