[发明专利]模型训练方法及装置在审

申请号：	202010520344.0	申请日：	2020-06-09
公开（公告）号：	CN111680631A	公开（公告）日：	2020-09-18
发明（设计）人：	熊凯	申请（专利权）人：	广州视源电子科技股份有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04;G06N3/08
代理公司：	北京康信知识产权代理有限责任公司 11240	代理人：	曾红芳
地址：	510530 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种模型训练方法及装置。其中，该方法包括：构造识别模型的损失函数，其中，损失函数包括辅助损失部分，辅助损失部分用于要求第一相似度大于第一相似度阈值，第一相似度为训练样本与该训练样本的目标原型之间的相似度；根据损失函数，训练识别模型。本发明解决了在相关技术中，在识别模型的训练与应用之间存在隔阂的技术问题。

技术领域

本发明涉及人工智能领域，具体而言，涉及一种模型训练方法及装置。

背景技术

基于深度神经网络的模型训练目前主要有两种方式，以人脸识别为例：一种是基于多分类进行训练，即学习将一张人脸图像，分配到某个类别中，这里类别数量等于训练数据集中的人数；另一种是基于度量学习，比如学习判定两张人脸图像是否为同一人(也有基于三张或多张人脸图像进行学习的)。以上两种训练过程，就是模型在学习如何抽取人脸的特征。在理想情况下，同一个人的不同照片的特征，相互距离很近，而不同人的照片的特征，相互距离很远。

人脸识别是计算机视觉的一个研究方向，目前已有大量落地应用，比如人脸签到、人脸支付和门禁系统等。人脸识别模型，就是对每一张查询人脸图像，计算出对应的特征向量，然后将其与预先计算并存储的人脸库的特征一一比对，找到最近的人脸ID及其距离，若这个最近的距离，小于事先设定好的距离阈值，则识别成功，认为该查询人脸的身份就是返回的ID。但基于多分类的方式中，人脸识别模型的训练过程和人脸识别模型的应用之间存在隔阂，训练模型时，并不涉及到距离阈值的概念，而实际应用时，需要基于交叉验证的方式，确定合适的距离阈值。

因此，在相关技术中，在识别模型的训练与应用之间存在隔阂的问题。针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种模型训练方法及装置，以至少解决在相关技术中，在识别模型的训练与应用之间存在隔阂的技术问题。

根据本发明实施例的一个方面，提供了一种模型训练方法，包括：构造识别模型的损失函数，其中，所述损失函数包括辅助损失部分，所述辅助损失部分用于要求第一相似度大于第一相似度阈值，所述第一相似度为训练样本与该训练样本的目标原型之间的相似度；根据所述损失函数，训练所述识别模型。

可选地，该方法还包括：通过以下方式，构造所述辅助损失部分：确定第二相似度，其中，所述第二相似度为与所述训练样本相似度最大的非目标原型与所述训练样本之间的相似度；根据所述第一相似度，第二相似度，以及所述第一相似度阈值，构造所述辅助损失部分。

可选地，根据所述第一相似度，第二相似度，以及所述第一相似度阈值，构造所述辅助损失部分，包括：通过以下公式，构造所述辅助损失部分：L_aux＝max(0,σ-W_yi*xi)+max(0,W_{max_j}*xi-σ)，其中，L_aux为所述辅助损失部分的损失值，yi为所述训练样本所属的类别，xi为所述训练样本采用所述识别模型提取的特征，W_yi为所述目标原型的特征，W_yi*xi为所述第一相似度，W_{max_j}为与所述训练样本相似度最大的非目标原型的特征，W_{max_j}*xi为所述第二相似度，σ为所述第一相似度阈值。

可选地，根据所述第一相似度，第二相似度，以及所述第一相似度阈值，构造所述辅助损失部分，包括：确定第二相似度阈值，其中，所述第一相似度阈值比所述第二相似度阈值至少大相似度间隔；根据所述第一相似度，所述第二相似度，所述第一相似度阈值，以及所述第二相似度阈值，构造所述辅助损失部分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司，未经广州视源电子科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010520344.0/2.html，转载请声明来源钻瓜专利网。

上一篇：电机系统的外特性参数确定方法、装置、电子设备及介质
下一篇：一种医用折叠式磁共振周转板装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]模型训练方法及装置在审

专利文献下载