[发明专利]模型训练方法及装置在审
申请号: | 202010520344.0 | 申请日: | 2020-06-09 |
公开(公告)号: | CN111680631A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 熊凯 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 曾红芳 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 | ||
本发明公开了一种模型训练方法及装置。其中,该方法包括:构造识别模型的损失函数,其中,损失函数包括辅助损失部分,辅助损失部分用于要求第一相似度大于第一相似度阈值,第一相似度为训练样本与该训练样本的目标原型之间的相似度;根据损失函数,训练识别模型。本发明解决了在相关技术中,在识别模型的训练与应用之间存在隔阂的技术问题。
技术领域
本发明涉及人工智能领域,具体而言,涉及一种模型训练方法及装置。
背景技术
基于深度神经网络的模型训练目前主要有两种方式,以人脸识别为例:一种是基于多分类进行训练,即学习将一张人脸图像,分配到某个类别中,这里类别数量等于训练数据集中的人数;另一种是基于度量学习,比如学习判定两张人脸图像是否为同一人(也有基于三张或多张人脸图像进行学习的)。以上两种训练过程,就是模型在学习如何抽取人脸的特征。在理想情况下,同一个人的不同照片的特征,相互距离很近,而不同人的照片的特征,相互距离很远。
人脸识别是计算机视觉的一个研究方向,目前已有大量落地应用,比如人脸签到、人脸支付和门禁系统等。人脸识别模型,就是对每一张查询人脸图像,计算出对应的特征向量,然后将其与预先计算并存储的人脸库的特征一一比对,找到最近的人脸ID及其距离,若这个最近的距离,小于事先设定好的距离阈值,则识别成功,认为该查询人脸的身份就是返回的ID。但基于多分类的方式中,人脸识别模型的训练过程和人脸识别模型的应用之间存在隔阂,训练模型时,并不涉及到距离阈值的概念,而实际应用时,需要基于交叉验证的方式,确定合适的距离阈值。
因此,在相关技术中,在识别模型的训练与应用之间存在隔阂的问题。针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种模型训练方法及装置,以至少解决在相关技术中,在识别模型的训练与应用之间存在隔阂的技术问题。
根据本发明实施例的一个方面,提供了一种模型训练方法,包括:构造识别模型的损失函数,其中,所述损失函数包括辅助损失部分,所述辅助损失部分用于要求第一相似度大于第一相似度阈值,所述第一相似度为训练样本与该训练样本的目标原型之间的相似度;根据所述损失函数,训练所述识别模型。
可选地,该方法还包括:通过以下方式,构造所述辅助损失部分:确定第二相似度,其中,所述第二相似度为与所述训练样本相似度最大的非目标原型与所述训练样本之间的相似度;根据所述第一相似度,第二相似度,以及所述第一相似度阈值,构造所述辅助损失部分。
可选地,根据所述第一相似度,第二相似度,以及所述第一相似度阈值,构造所述辅助损失部分,包括:通过以下公式,构造所述辅助损失部分:Laux=max(0,σ-Wyi*xi)+max(0,Wmax_j*xi-σ),其中,Laux为所述辅助损失部分的损失值,yi为所述训练样本所属的类别,xi为所述训练样本采用所述识别模型提取的特征,Wyi为所述目标原型的特征,Wyi*xi为所述第一相似度,Wmax_j为与所述训练样本相似度最大的非目标原型的特征,Wmax_j*xi为所述第二相似度,σ为所述第一相似度阈值。
可选地,根据所述第一相似度,第二相似度,以及所述第一相似度阈值,构造所述辅助损失部分,包括:确定第二相似度阈值,其中,所述第一相似度阈值比所述第二相似度阈值至少大相似度间隔;根据所述第一相似度,所述第二相似度,所述第一相似度阈值,以及所述第二相似度阈值,构造所述辅助损失部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010520344.0/2.html,转载请声明来源钻瓜专利网。