[发明专利]一种基于深度学习的改进损失函数的步态识别方法在审

申请号：	202010696163.3	申请日：	2020-07-20
公开（公告）号：	CN111985332A	公开（公告）日：	2020-11-24
发明（设计）人：	胡海根;汪鹏飞;吴泽成;周乾伟;李小薪;钱汉望	申请（专利权）人：	浙江工业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06K9/46;G06K9/62;G06N3/04
代理公司：	杭州斯可睿专利事务所有限公司 33241	代理人：	王利强
地址：	310014 浙江省***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习改进损失函数步态识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种基于深度学习的改进损失函数的步态识别方法，包括以下步骤：步骤1、获取行人步态数据集；步骤2、对步骤1得到的训练数据进行预处理，利用中心线原则将数据切割成64*64；步骤3、搭建深度卷积神经网络；步骤4、设计损失函数；步骤5、初始化神经网络参数；步骤6、训练搭建好的神经网络，将步骤2得到的训练样本作为输入，对应的实际身份标签作为输出，成批次地输入到网络中，计算损失后，通过反向传播算法，调整网络参数和损失函数的权重；步骤7、使用训练好的网络对未知数据进行识别，分为注册与识别两个阶段。通过本发明的方法能够更好的保留时间和空间维度上的运动信息，在背包、穿大衣等复杂场景下达到更好的识别效果。

技术领域

本发明属于计算机视觉技术领域，涉及一种基于深度学习的改进损失函数的步态识别方法。

技术背景

步态识别通过人们走路的姿势进行身份识别，与其它的生物特征识别技术相比，步态识别具有非接触、远距离和不容易伪装等优点，在预防犯罪、法医鉴定和社会保障方面具有广泛的应用。

目前步态识别主要分为看作图像和看作视频序列两大类方法。前者将所有的步态轮廓图压缩成一副图像，将步态识别看成一个图像匹配问题，很显然这种方法忽视了步态中的时间维度上的信息，也无法建模精细的空间维度的信息；后者从轮廓中提取特征，使用LSTM、3D-CNN或者双流法，可以很好地建模步态识别中时间、空间维度的信息，但其计算代价高昂也不易于训练。目前步态识别方法基本都是在去背景的二值化图上面进行，准确率受目标自身的穿着、打扮与摄像头的角度等因素的影响。

发明内容

为了克服现有技术的不足，在易于训练的同时不丢失时间、空间维度的信息，同时能提高在目标穿大衣、背包等复杂场景下的准确率，本发明提供一种基于深度学习的改进损失函数的步态识别方法，将步态图像看成图像集合，并对损失函数进行改进。

为了解决上述技术问题，本发明能够提供如下的技术方案：

一种基于深度学习的改进损失函数的步态识别方法，所述方法包括以下步骤：

步骤1.使用步态识别数据集或者自行建立数据集，所述步态识别数据集为CASIA-B或OU-MVLP，并对数据集进行预处理，过程如下：

1.1)若使用图像采集设备采集行人的步态图像，对采集到的图像使用deeplabv3+提取人体目标轮廓，转换成二值化图像；

1.2)利用中心线原则将图像切割成64*64；

1.3)将数据集分为训练集和测试集；

步骤2.训练阶段，即在训练集上训练深度卷积神经网络，过程如下：

2.1)搭建深度卷积神经网络，CNN模块提取图像的帧级特征，SP模块从帧级特征中提取序列级特征，MGP模块用于提取不同级别的序列信息，HPM用于同时提取局部和全局特征；

2.2)设计损失函数，定义损失函数如下：

其中，an表示原样本，po表示与an同一类别的样本，ne表示与an不同类别的样本，d(x,y)表示x和y在embedding空间上的欧式距离，margin为正整数用于扩大不同标签样本之间的距离，N表示一个batch中样本的数量，M表示类别的数量，P表示一个batch中的人数，K表示一个batch中每个人图片的数量，P(X)表示样本真实的分布，Q(X)表示网络预测的分布，L_BCE和L_BF为改进的损失函数；

2.3)将损失函数的权重σ₁和σ₂作为网络的参数；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010696163.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种风电基地升压站选址方法
下一篇：一种芯片无压烧结互连用纳米铜浆及其制备方法与应用

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的改进损失函数的步态识别方法在审

专利文献下载