[发明专利]机器学习模型的训练方法、装置和计算机可读存储介质在审

申请号：	201910711318.3	申请日：	2019-08-02
公开（公告）号：	CN112308232A	公开（公告）日：	2021-02-02
发明（设计）人：	叶韵;张炜;梅涛	申请（专利权）人：	北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号：	G06N20/00	分类号：	G06N20/00;G06N3/04;G06N3/08
代理公司：	中国贸促会专利商标事务所有限公司 11038	代理人：	张雷;许蓓
地址：	100086 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	机器学习模型训练方法装置计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开涉及一种机器学习模型的训练方法、装置和计算机可读存储介质，涉及人工智能技术领域。该方法包括：利用机器学习模型，计算各图像样本关于各属性的隶属概率以确定各图像样本是否具有相应的属性；根据各隶属概率和各图像样本关于各属性的标注结果，确定机器学习模型对各图像样本关于各属性的错误处理概率；根据各错误处理概率和各损失参数，确定第一损失函数，各损失参数与相应的各隶属概率负相关；利用第一损失函数，训练机器学习模型。本公开的技术方案能够提高机器学习模型的准确性。

技术领域

本公开涉及人工智能技术领域，特别涉及一种机器学习模型的训练方法、机器学习模型的训练装置和计算机可读存储介质。

背景技术

在涉及多类别识别的机器学习过程中，训练样本往往为各分类标签数量不均衡的数据集。在这种情况下，就会导致训练样本较少的类别的分类准确率很低。

在相关技术中，可以通过在线难样本挖掘、上采样、下采样等方法处理上述情况。

但是应用到属性识别问题上时，常常会因为很大数量的属性导致结果被平均后削弱。

还有一大类方法是进行传统的重采样方法有两大缺陷：第一，如果进行降采样(对训练样本子集采样)，则有丢失信息的分享，如果进行上采样(对数量少的样本进行复制或增强再采样)则有很强的过拟合风险。

发明内容

本公开的发明人发现上述相关技术中存在如下问题：需要确定的类型较多的情况下，会造成分类结果被平均后削弱；或者存在信息丢失、过拟合等问题，从而导致训练出来的机器学习模型的准确性低。

鉴于此，本公开提出了一种机器学习模型的训练技术方案，能够提高机器学习模型的准确性。

根据本公开的一些实施例，提供了一种机器学习模型的训练方法，包括：利用机器学习模型，计算各图像样本关于各属性的隶属概率以确定所述各图像样本是否具有相应的属性；根据各隶属概率和所述各图像样本关于所述各属性的标注结果，确定所述机器学习模型对所述各图像样本关于所述各属性的错误处理概率；根据各错误处理概率和各损失参数，确定第一损失函数，所述各损失参数与相应的所述各隶属概率负相关；利用所述第一损失函数，训练所述机器学习模型。

在一些实施例中，所述确定所述机器学习模型对所述各属性的错误处理概率包括：根据各标注结果与相应的所述各隶属概率的差值，确定所述各错误处理概率，标注结果为0表示所述各图像样本不具有相应属性，标注结果为1表示所述各图像样本具有相应属性。

在一些实施例中，所述确定所述各错误处理概率包括：根据所述差值的绝对值的γ次方，确定所述各错误处理概率，γ为大于1的整数。

在一些实施例中，所述确定第一损失函数包括：根据所述各损失参数的加权和平均值，确定所述第一损失函数，所述各损失参数的权值根据所述各错误处理概率确定。

在一些实施例中，所述第一损失函数与所述各损失参数的加权和正相关，所述第一损失函数与所述各错误处理概率的加权和负相关。

在一些实施例中，该训练方法还包括：将大于阈值的错误处理概率对应的属性确定为目标属性；根据所述目标属性，利用生成对抗网络GAN(Generative AdversarialNetworks，生成对抗网络)模型生成补充图像样本用于训练所述机器学习模型。

在一些实施例中，所述训练所述机器学习模型包括：根据所述补充图像样本的标注结果，利用所述机器学习模型，确定第二损失函数；利用所述第一损失函数和所述第二损失函数，训练所述机器学习模型。

在一些实施例中，所述确定第二损失函数包括：将所述补充图像样本的标注结果设置为激活标签和不激活标签以外的补充标签，根据所述补充标签确定所述第二损失函数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司，未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910711318.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]机器学习模型的训练方法、装置和计算机可读存储介质在审

专利文献下载