[发明专利]基于注意力机制的人脸年龄估计方法及装置有效

申请号：	202310116722.2	申请日：	2023-02-15
公开（公告）号：	CN115862119B	公开（公告）日：	2023-06-13
发明（设计）人：	杨通;杜曦;张金宝;熊传旺	申请（专利权）人：	南京开为网络科技有限公司
主分类号：	G06V40/16	分类号：	G06V40/16;G06V10/766;G06V10/82;G06N3/084;G06N3/0464;G06N3/047
代理公司：	南京中擎科智知识产权代理事务所(普通合伙) 32549	代理人：	黄智明
地址：	210000 江苏省南京市建***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于注意力机制年龄估计方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出基于注意力机制的人脸年龄估计方法及装置，该方法通过预先构建的人脸年龄估计模型对输入图像进行人脸年龄估计，所述人脸年龄估计模型包括依次连接的卷积神经网络模块、标签分布学习网络模块和高斯回归网络模块。本发明设计了新的卷积神经网络结构和新型的损失函数，可以在提高准确率的前提下，快速的进行人脸年龄估计。

技术领域

本发明涉及人脸识别技术领域，具体涉及一种基于注意力机制的人脸年龄估计方法及装置。

背景技术

人脸年龄估计是指利用设备的摄像头获取人脸图片，并由机器根据获取到的面部图片估计出此人的年龄或者所属年龄段。早期的年龄估计方法来自于Kwon和Lobo，其将年龄简单的划分为三组，分别是孩童，青年和老年人；其后，Lanities提出了 AAM，其在人脸图片上提取造型和外观特征并用于年龄估计；后来，BIF特征被证明在年龄估计数据集上是高效的；近年来，基于CNN的方法由于其优越的性能表现而被广泛应用于年龄估计，如DEX将年龄划分为101个年龄组，每个年龄组作为一个类别；然而，将年龄估计看成是分类问题完全忽略了年龄标签的连续性和模糊性，因为人脸老化是一个持续性的进程，而不是独立的类别；纯回归问题又将其过度简化成线性模型，而人脸年龄一般都是非线性的。基于上述原因，当前的人脸年龄估计方案的准确度较低。

发明内容

发明目的：为克服以上技术问题，本发明提出一种基于注意力机制的人脸年龄估计方法及装置。该方法设计了新的卷积神经网络结构和新型的损失函数，可以在提高准确率的前提下，快速的进行人脸年龄估计。

发明内容；为实现上述目的，本发明提出以下技术方案。

第一方面，本公开实施例提出一种基于注意力机制的人脸年龄估计方法，所述方法通过预先构建的人脸年龄估计模型对输入图像进行人脸年龄估计，所述人脸年龄估计模型包括依次连接的卷积神经网络模块、标签分布学习网络模块和高斯回归网络模块；

所述卷积神经网络模块的构建方法为：以VGG网络为基础模型，去除VGG网络中所有的全连接层，然后在VGG网络的前三个卷积块的最大池化层之后分别增加一个SE模块，在VGG网络的第四个卷积块的卷积层后依次连接通道注意力模块CAM和空间注意力模块SAM，在VGG网络的最后一个卷积块的最大池化层之后增加全局平均池化层，得到所述卷积神经网络模块；

所述标签分布学习网络模块包括一个全连接层、一个Softmax层和KL损失函数层；

所述高斯回归网络模块包括一个回归器和一个高斯损失函数层，所述高斯损失函数为：

；

其中，N表示输入样本图像的总数，m表示输入样本图像的年龄均值， l表示所述输入样本图像的年龄标签向量， P表示相应的概率密度；y表示真实年龄值。

具体的，所述概率密度通过概率密度函数计算得到，所述概率密度函数为：，表示高斯分布的标准差，表示年龄预测值。

作为本公开实施例所述基于注意力机制的人脸年龄估计方法的一种可选实施方式，所述人脸年龄估计模型的训练步骤包括：

1）将样本图片输入所述卷积神经网络模块进行人脸年龄特征提取；

2）将所述人脸年龄特征输入至所述标签分布学习网络模块，经由所述Softmax 层输出预测年龄分布，然后将所述预测年龄分布与真实年龄分布一起输入至所述KL损失函数层；

3）将所述预测年龄分布输入所述回归器得出预测年龄，然后将所述预测年龄与真实年龄输入所述高斯损失函数层；

4）通过反向传播算法对KL损失函数和高斯损失函数进行联合训练，寻找最优权重；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载