[发明专利]基于注意力机制的人脸年龄估计方法及装置有效
申请号: | 202310116722.2 | 申请日: | 2023-02-15 |
公开(公告)号: | CN115862119B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 杨通;杜曦;张金宝;熊传旺 | 申请(专利权)人: | 南京开为网络科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/766;G06V10/82;G06N3/084;G06N3/0464;G06N3/047 |
代理公司: | 南京中擎科智知识产权代理事务所(普通合伙) 32549 | 代理人: | 黄智明 |
地址: | 210000 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 年龄 估计 方法 装置 | ||
1.基于注意力机制的人脸年龄估计方法,所述方法通过预先构建的人脸年龄估计模型对输入图像进行人脸年龄估计,其特征在于,所述人脸年龄估计模型包括依次连接的卷积神经网络模块、标签分布学习网络模块和高斯回归网络模块;
所述卷积神经网络模块的构建方法为:以VGG网络为基础模型,去除VGG网络中所有的全连接层,然后在VGG网络的前三个卷积块的最大池化层之后分别增加一个SE模块,在VGG网络的第四个卷积块的卷积层后依次连接通道注意力模块CAM和空间注意力模块SAM,在VGG网络的最后一个卷积块的最大池化层之后增加全局平均池化层,得到所述卷积神经网络模块;
所述标签分布学习网络模块包括一个全连接层、一个Softmax层和KL损失函数层;
所述高斯回归网络模块包括一个回归器和一个高斯损失函数层,高斯损失函数为:;其中,N表示输入样本图像的总数,m表示输入样本图像的年龄均值,
所述人脸年龄估计模型的训练步骤包括:
1)将样本图片输入所述卷积神经网络模块进行人脸年龄特征提取;
2)将所述人脸年龄特征输入至所述标签分布学习网络模块,经由所述Softmax层输出预测年龄分布,然后将所述预测年龄分布与真实年龄分布一起输入至所述KL损失函数层;
3)将所述预测年龄分布输入所述回归器得出预测年龄,然后将所述预测年龄与真实年龄输入所述高斯损失函数层;
4)通过反向传播算法对KL损失函数和高斯损失函数进行联合训练,寻找最优权重;所述联合训练的总损失函数为:,其中,和为权重系数,为L2正则项,,表示年龄预测值的概率密度函数;
5)保存所述最优权重,得到训练好的所述人脸年龄估计模型。
2.根据权利要求1所述的基于注意力机制的人脸年龄估计方法,其特征在于,所述样本图片的构建方法为:
采用人脸检测器获取每个输入图片的人脸关键点坐标和人脸框坐标,剔除未检测到人脸图片;
根据检测到的所述人脸关键点计算人脸偏移角度,并根据仿射变换矩阵执行人脸对齐操作,最后将对齐之后的所述输入图片按照设定尺寸进行裁剪、填充、添加真实年龄标签,得到所述样本图片。
3.根据权利要求1所述的基于注意力机制的人脸年龄估计方法,其特征在于,所述通道注意力模块CAM的表达式为:
;
其中,为sigmoid激活函数,MLP为多层感知机,和为权重系数,,,表示输入图像,表示平均池化,表示最大池化,表示最大池化特征,表示平均池化特征。
4.根据权利要求1所述的基于注意力机制的人脸年龄估计方法,其特征在于,所述空间注意力模块SAM的表达式为:
;
其中,是空间注意力模块SAM的输入图像,为sigmoid激活函数,表示平均池化,表示最大池化,表示经过平均池化后的特征图像,表示经过最大池化后的特征图像,表示进行卷积核为7x7 的卷积运算。
5.基于注意力机制的人脸年龄估计装置,其特征在于,包括处理器和存储器;所述存储器存储有计算机程序,而所述处理器执行所述计算机程序,以实现权利要求1至4任意一项所述的基于注意力机制的人脸年龄估计方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序能够被处理器执行,以实现权利要求1至4任意一项所述的基于注意力机制的人脸年龄估计方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京开为网络科技有限公司,未经南京开为网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310116722.2/1.html,转载请声明来源钻瓜专利网。