[发明专利]机器学习模型的训练方法及装置、样本处理方法及装置有效
申请号: | 202010104680.7 | 申请日: | 2020-02-20 |
公开(公告)号: | CN111340233B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 张望舒;温祖杰 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08;G06N7/00 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 模型 训练 方法 装置 样本 处理 | ||
本说明书实施例提供一种机器学习模型的训练方法,该方法包括:基于获取的原始样本集,对执行相同任务的多个预测模型进行多轮训练,得到多个训练后模型。其中任一轮训练具体包括:先对原始样本集进行采样,得到若干原始样本,其中包括任意的第一原始样本,此样本中包括第一样本特征和第一样本标签;接着将第一样本特征分别输入多个预测模型中,得到多个第一预测结果;然后至少基于多个第一预测结果和第一样本标签,确定出现频次最高的第一最高频结果;进一步地,在第一最高频结果唯一的情况下,利用该结果对所述第一样本标签进行修正,得到第一修正样本;再接着利用根据所述若干原始样本得到的若干修正样本,分别训练所述多个预测模型。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种机器学习模型的训练方法及装置,以及一种样本处理方法及装置。
背景技术
随着机器学习的兴起,许多领域尝试训练机器学习模型,以完成特定任务。比如说,在图片处理领域,通过训练图片识别模型,来识别图片中包含的目标对象。又比如说,在客服领域,通过训练标问预测模型,来确定用户会话对应的标准问题。
目前,对于训练得到的机器学习模型,其预测性能很大程度上依赖训练样本的质量和数量。通常,训练样本的质量越高、数量越多,训练所得模型的预测性能越优。然而,实际出于多种原因,获取足够数量的高质量训练样本十分困难,并且获取的训练样本中或多或少存在标注不准确或错误的样本。
因此,迫切需要一种合理、可靠的方案,可以利用存在低质量训练样本的训练样本集,训练出性能较优的机器学习模型。
发明内容
本说明书一个或多个实施例描述了一种机器学习模型的训练方法及装置,相较于直接利用原始样本集训练机器学习模型,通过对原始样本集中的样本进行去噪、优化处理,可以进一步提高机器学习模型的预测性能。
根据第一方面,提供一种机器学习模型的训练方法,该方法包括:获取原始样本集和用于执行相同任务的多个预测模型;基于原始样本集,对所述多个预测模型进行多轮训练,得到多个训练后模型;其中,所述多轮训练中的任一轮训练具体包括:对所述原始样本集进行采样,得到若干原始样本,其中包括任意的第一原始样本,所述第一原始样本中包括第一样本特征和第一样本标签;将所述第一样本特征分别输入所述多个预测模型中,得到多个第一预测结果;至少基于所述多个第一预测结果和所述第一样本标签,确定出现频次最高的第一最高频结果;在所述第一最高频结果唯一的情况下,利用所述第一最高频结果对所述第一样本标签进行修正,得到第一修正样本;利用根据所述若干原始样本得到的若干修正样本,分别训练多个预测模型。
在一个实施例中,所述原始样本集为图片样本集,所述相同任务为图片处理任务,所述多个预测模型为多个图片处理模型;或,所述原始样本集为文本样本集,所述相同任务为文本处理任务,所述多个预测模型为多个文本处理模型;或,所述原始样本集为音频样本集,所述相同任务为音频处理任务,所述多个预测模型为多个音频处理模型。
在一个实施例中,所述第一原始样本为客服场景下的第一用户会话样本,所述第一样本特征包括第一用户会话特征,所述第一样本标签指示第一用户标准问题,所述相同任务为确定用户会话对应的标准问题,所述多个预测模型为多个标问预测模型。
在一个实施例中,获取的多个预测模型为N个预训练模型,所述N个预训练模型基于以下步骤而得到:将所述将原始样本集分割为N个样本集,其中包括第i个样本集;获取参数初始化的N个初始模型,其中包括第i个初始模型;利用所述第i个样本集训练第i个初始模型,得到第i个预训练模型,归入所述N个预训练模型;其中,i和N为正整数,并且N≥2,i≤N。
在一个具体的实施例中,所述N个初始模型对应N套初始化模型参数,所述N套初始化模型参数中任意的两套模型参数不完全相同。
在一个更具体的实施例中,获取参数初始化的N个初始模型,包括:设定互不相同的N个随机种子;基于随机算法,利用所述N个随机种子对应生成N套随机数,作为所述N套初始化模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010104680.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:类型确定方法及装置
- 下一篇:基于AMP系统的FLASH访问处理方法及装置