[发明专利]人脸识别模型的训练方法及装置在审
申请号: | 202211696114.5 | 申请日: | 2022-12-28 |
公开(公告)号: | CN115830692A | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 蒋召;黄泽元;杨战波 | 申请(专利权)人: | 北京龙智数科科技服务有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82;G06V10/74;G06N3/04;G06N3/084 |
代理公司: | 北京嘉科知识产权代理事务所(特殊普通合伙) 11687 | 代理人: | 陈美君 |
地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 模型 训练 方法 装置 | ||
本公开涉及人脸识别技术领域,提供了一种人脸识别模型的训练方法及装置。该方法包括:利用人脸识别模型提取每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
技术领域
本公开涉及人脸识别技术领域,尤其涉及一种人脸识别模型的训练方法及装置。
背景技术
现有的人脸识别模型包含基于比对的方式和基于分类的方式,基于比对的方式,需要构造大量的正负样本对,训练的目标是拉近正样本对的距离,拉远负样本对的距离,从而学习到有区分性的特征,这种称为样本对之间的比对;基于分类的方式是将每一类别用一个权重表示,该权重可以称作该类的原型或者类中心,训练目标为样本与该原型的比较过程。这两种方法均在训练阶段和推理阶段存在差异。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下技术问题:人脸识别模型在训练阶段和推理阶段存在差异的问题。
发明内容
有鉴于此,本公开实施例提供了一种人脸识别模型的训练方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,人脸识别模型在训练阶段和推理阶段存在差异的问题。
本公开实施例的第一方面,提供了一种人脸识别模型的训练方法,包括:利用全局平均池化层、全连接层和激活层构建注意力模块;利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
本公开实施例的第二方面,提供了一种人脸识别模型的训练装置,包括:第一构建模块,被配置为利用全局平均池化层、全连接层和激活层构建注意力模块;第二构建模块,被配置为利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取模块,被配置为获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;提取模块,被配置为利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;第一计算模块,被配置为计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;第二计算模块,被配置为根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;训练模块,被配置为基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京龙智数科科技服务有限公司,未经北京龙智数科科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211696114.5/2.html,转载请声明来源钻瓜专利网。