[发明专利]人脸识别模型的训练方法、装置、电子设备和存储介质在审
| 申请号: | 202010722196.0 | 申请日: | 2020-07-24 |
| 公开(公告)号: | CN111860364A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 沈涛 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海隆天律师事务所 31282 | 代理人: | 徐莉;钟宗 |
| 地址: | 200233 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种人脸识别模型的训练方法,其特征在于,包括步骤:
获得人脸识别模型的批处理数据量和训练集的类别数;
基于随机数构建0-1分布,生成列数为所述类别数的参数向量;
根据所述参数向量调整人脸识别损失函数的固定缩放比例,获得可调缩放向量,并根据所述可调缩放向量获得行数为所述批处理数据量且列数为所述类别数的缩放矩阵;
采用所述缩放矩阵对所述人脸识别模型的输出进行重缩放;以及
基于重缩放后的输出,监督训练所述人脸识别模型。
2.如权利要求1所述的训练方法,其特征在于,所述人脸识别模型基于深度卷积神经网络构建,所述人脸识别损失函数是加性角度间隔损失函数。
3.如权利要求1所述的训练方法,其特征在于,根据所述参数向量调整人脸识别损失函数的固定缩放比例的步骤包括:
altered_s=S+selected_vector*S*2*(1-cosθj),
其中,altered_s是所述可调缩放向量,所述可调缩放向量的列数为所述类别数,S是所述固定缩放比例,selected_vector是所述参数向量,θj是相邻两类别的类中心向量的夹角,所述类中心向量根据所述人脸识别模型的输出获得。
4.如权利要求1所述的训练方法,其特征在于,根据所述参数向量调整人脸识别损失函数的固定缩放比例的步骤包括:
altered_s=S+selected_vector*S*2*(1-cos(θyi+m).mean(dim=0)),
其中,altered_s是所述可调缩放向量,所述可调缩放向量的列数为所述类别数,S是所述固定缩放比例,selected_vector是所述参数向量,cos(θyi+m)是当前特征向量和目标类中心向量的夹角与一角度间隔值之和的余弦值,所述余弦值是行数为所述批处理数据量且列数为所述类别数的矩阵,所述当前特征向量根据所述人脸识别模型的输出获得。
5.如权利要求3或4所述的训练方法,其特征在于,所述固定缩放比例的取值为:S=64,所述相邻两类别的类中心向量的夹角的取值为:θj=71.61÷360×2π弧度。
6.如权利要求1所述的训练方法,其特征在于,基于随机数构建0-1分布,生成列数为所述类别数的参数向量的步骤包括:
取一随机种子进行0与1的平均分布选择,生成所述参数向量;以及
将所述参数向量注册成为固定向量。
7.如权利要求1所述的训练方法,其特征在于,采用所述缩放矩阵对所述人脸识别模型的输出进行重缩放的步骤包括:
altered_s’*cos(θyi+m),
其中,altered_s’是所述缩放矩阵,所述缩放矩阵由所述可调缩放向量按行重复所述批处理数据量后形成,cos(θyi+m)是当前特征向量和目标类中心向量的夹角与一角度间隔值之和的余弦值,所述余弦值是行数为所述批处理数据量且列数为所述类别数的矩阵,所述当前特征向量根据所述人脸识别模型的输出获得。
8.如权利要求1所述的训练方法,其特征在于,基于重缩放后的输出,监督训练所述人脸识别模型的步骤包括:
根据重缩放后的输出,通过逻辑回归Softmax获得所述人脸识别模型的预测概率;以及
基于交叉熵损失函数计算所述预测概率与目标概率的差值,对所述人脸识别模型进行监督训练,直至所述人脸识别模型收敛于所述训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010722196.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:组合式定子铁芯、电机、压缩机、空调器
- 下一篇:一种氧化涂料用环保附涂装置





