[发明专利]模型训练方法及装置在审
申请号: | 202010520344.0 | 申请日: | 2020-06-09 |
公开(公告)号: | CN111680631A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 熊凯 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 曾红芳 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 | ||
1.一种模型训练方法,其特征在于,包括:
构造识别模型的损失函数,其中,所述损失函数包括辅助损失部分,所述辅助损失部分用于要求第一相似度大于第一相似度阈值,所述第一相似度为训练样本与该训练样本的目标原型之间的相似度;
根据所述损失函数,训练所述识别模型。
2.根据权利要求1所述的方法,其特征在于,还包括,通过以下方式,构造所述辅助损失部分:
确定第二相似度,其中,所述第二相似度为与所述训练样本相似度最大的非目标原型与所述训练样本之间的相似度;
根据所述第一相似度,第二相似度,以及所述第一相似度阈值,构造所述辅助损失部分。
3.根据权利要求2所述的方法,其特征在于,根据所述第一相似度,第二相似度,以及所述第一相似度阈值,构造所述辅助损失部分,包括:
通过以下公式,构造所述辅助损失部分:
Laux=max(0,σ-Wyi*xi)+max(0,Wmax_j*xi-σ),
其中,Laux为所述辅助损失部分的损失值,yi为所述训练样本所属的类别,xi为所述训练样本采用所述识别模型提取的特征,Wyi为所述目标原型的特征,Wyi*xi为所述第一相似度,Wmax_j为与所述训练样本相似度最大的非目标原型的特征,Wmax_j*xi为所述第二相似度,σ为所述第一相似度阈值。
4.根据权利要求2所述的方法,其特征在于,根据所述第一相似度,第二相似度,以及所述第一相似度阈值,构造所述辅助损失部分,包括:
确定第二相似度阈值,其中,所述第一相似度阈值比所述第二相似度阈值至少大相似度间隔;
根据所述第一相似度,所述第二相似度,所述第一相似度阈值,以及所述第二相似度阈值,构造所述辅助损失部分。
5.根据权利要求4所述的方法,其特征在于,根据所述第一相似度,所述第二相似度,所述第一相似度阈值,以及所述第二相似度阈值,构造所述辅助损失部分,包括:
通过以下公式,构造所述辅助损失部分:
Laux=max(0,σH-Wyi*xi)+max(0,Wmax_j*xi-σL),且σH-σL=α>0,
其中,Laux为所述辅助损失部分的损失值,yi为所述训练样本所属的类别,xi为所述训练样本采用所述识别模型提取的特征,Wyi为所述目标原型的特征,Wyi*xi为所述第一相似度,Wmax_j为与所述训练样本相似度最大的非目标原型的特征,Wmax_j*xi为所述第二相似度,σH为所述第一相似度阈值,σL为所述第二相似度阈值,α为所述相似度间隔。
6.根据权利要求4所述的方法,其特征在于,所述第一相似度阈值和所述第二相似度阈值均通过以下方式至少之一确定:
固定值;
通过目标拟合函数得到的拟合值;
通过最小化所述辅助损失部分得到的优化值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010520344.0/1.html,转载请声明来源钻瓜专利网。