[发明专利]一种人脸轻量网络模型构建方法和人脸识别方法在审
申请号: | 202110947540.0 | 申请日: | 2021-08-18 |
公开(公告)号: | CN113723238A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 吴翔;苏晓生 | 申请(专利权)人: | 北京深感科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 厦门天诚欣创知识产权代理事务所(普通合伙) 35266 | 代理人: | 何妍 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人脸轻量 网络 模型 构建 方法 识别 | ||
1.一种人脸轻量网络模型构建方法,其特征在于,包括如下步骤:
步骤A、获取指定数量的标记有人脸身份类别信息的人脸数字图像作为训练数据集;
步骤B、基于softmax损失函数,利用所述训练数据集对一个重量的人脸识别卷积神经网络T进行训练,获取训练后的模型;
步骤C、基于嵌入空间蒸馏损失函数,利用步骤B阶段所获取的训练模型和训练数据集对轻量级的人脸识别卷积神经网络S进行训练,获取训练后的基于嵌入空间蒸馏的人脸轻量网络模型。
2.根据权利要求1所述的一种人脸轻量网络模型构建方法,其特征在于,所述步骤B,具体包括:
步骤B1、利用所述训练数据集训练后,获取一个人脸识别卷积网络T;
步骤B2、定义zT为所述人脸识别卷积网络T最后一个全连接层的输出;定义pT为所述人脸识别卷积网络T经过softmax获取的输出概率,则
其中,表示所述人脸识别神经网络T输出概率pT的第i维输出;表示所述人脸识别卷积网络T最后一个全连接输出zT的第i维输出;表示所述人脸识别卷积网络T最后一个全连接输出zT的第j维输出;K表示所述训练数据集的总类别数;zT、pT均为K维的列向量;
步骤B3、定义fT为所述人脸识别神经网络T的输出特征;定义为所述人脸识别卷积网络T对应第yi类的特征向量的中心向量,表示为
其中,表示所述训练数据集第yi类的样本数量;表示所述人脸识别卷积网络T对应第j个样本的输出特征;均为D维的列向量;D为所述人脸识别卷积网络T特征向量的维度。
3.根据权利要求1所述的一种人脸轻量网络模型构建方法,其特征在于,所述步骤C包括:
步骤C1、随机初始化一轻量级人脸识别卷积网络S,定义zS为所述轻量级人脸识别卷积网络S最后一个全连接层的输出;定义pS为所述轻量级人脸识别卷积网络S经过softmax获取的输出概率;定义fS为所述轻量级人脸识别卷积网络S的输出特征;
步骤C2、定义目标函数1,所述目标函数1为:
其中,N表示所述训练数据集样本总数;yi表示第i个样本对应的类别标签;表示第i个样本对应所述轻量级人脸识别卷积网络S的最后一个全连接层的第yi维输出;表示第i个样本对应所述轻量级人脸识别卷积网络S最后一个全连接层的第j维输出;K表示所述训练数据集的总类别数;τ和λ分别表示给定的常数;
步骤C3、定义目标函数2,所述目标函数2为:
其中,N表示所述训练数据集样本总数;yi表示第i个样本对应的类别标签;表示第i个样本对应所述轻量级人脸识别卷积网络S的输出特征;表示所述人脸识别卷积网络T对应第yi类的中心向量;表示表示所述人脸识别卷积网络T对应第j类的中心向量;
步骤C4、根据步骤C2、步骤C3所述,该方法的目标函数表示为:
Ltotal=λ1L1+λ2L2
其中,λ1和λ2为常数;
步骤C5、将步骤C4的所述目标函数Ltotal作为损失函数,利用所述训练数据集,根据基于随机梯度下降的反向传播算法,更新所述轻量级人脸识别卷积网络S中可学习的模型参数,以获取更新处理后的基于嵌入空间蒸馏的人脸轻量网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深感科技有限公司,未经北京深感科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110947540.0/1.html,转载请声明来源钻瓜专利网。