[发明专利]基于深度序分布回归的步态年龄估计方法有效
申请号: | 201811255447.8 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109543546B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 朱海平;张军平 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/764 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 分布 回归 步态 年龄 估计 方法 | ||
1.一种基于深度序分布回归的步态年龄估计方法,其特征在于,具体步骤为:
(1)步态视频序列预处理
先做行人检测与对齐,接着做目标与背景的分割,然后将预处理好的视频序列拍成步态能量图,该步态能量图记为GEI;并将GEI分割成不重叠的头部、上身部、下半身部三个部分;
(2)序回归方法的数据划分
对于有序的K分类问题,将K分类问题转换成一系列二分类问题,也就是训练K-1个二分类器;
(3)用全局与局部卷积神经网络提取特征
用一个全局网络和三个子网络分别提取全局步态特征和三个局部步态特征,三个局部步态特征即为头部、上身部、下半身部的步态特征;
(4)利用序分布损失函数训练网络模型
损失函数的设计,既考虑交叉熵损失,也考虑分布损失:
(a)交叉熵损失函数为:
其中,N是样本数量,K是类别数量,表示第i个样本的第k个二分类的真实值,是对应的预测值;
(b)EMD分布损失函数为:
其中,CDF是累积分布函数;
(c)总的损失函数为:
表示总的损失函数,表示交叉熵损失函数,表示分布损失函数,λ是超参数,用于平衡分布损失的影响;
步骤(2)中,对第k个二分类器,将训练集D重新划分成两个子集:样本年龄标签大于或等于rk的为正样本,小于rk的为负样本,即
这里rk是第k个分类器的等级划分参数,总共有K-1个等级划分;在K-1个二分类器训练完,给定测试样本xi,对应的预测年龄计算如下:
其中,fk(xi)是第k个二分类的输出结果,范围在(0,1),[.]表示真假运算,里面条件成立则为1,否则为0。
2.根据权利要求1所述的基于深度序分布回归的步态年龄估计方法,其特征在于,步骤(1)中,在输入网络之前,将GEI图像调整成128×88统一尺寸大小;分割的不重叠的头部、上身部、下半身部图像的大小分别为(22×88)、(48×88)、(58×88)。
3.根据权利要求1所述的基于深度序分布回归的步态年龄估计方法,其特征在于,步骤(3)中,全局与局部卷积神经网络提取特征的流程为:
像素大小为128×88×1的GEI图片作为全局网络的输入;将GEI切割成像素大小分别为(22×88)、(48×88)、(58×88)的头部、上身部和下半身部,作为三个子网络的输入;
其中,全局特征网络为两层,卷积核大小分别为(7,7),(7,7);三个子网络有两层,且三个子网络卷积核大小相同,分别为(7,7),(5,7);三个子网络经过两层卷积后,在高维度上将三个特征图拼接,然后再与全局网络输出的特征图在通道维度上拼接;后面在接一层卷基层和三个全连接层,最后输出K-1维二分类结果;其中,最后一层卷基层的卷积核大小为(5,5),前两个全连接层的维度是1024,最后一层全连接层输出为K-1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811255447.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:快速人脸检测方法及装置
- 下一篇:人脸图像识别方法、装置、设备及存储介质