[发明专利]一种模型的训练方法、装置、设备及可读存储介质在审
申请号: | 202010269451.0 | 申请日: | 2020-04-08 |
公开(公告)号: | CN111461329A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 严洁;张静;栾英英;童楚婕;彭勃;李福洋;徐晓健 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06F16/215;G06N20/00;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 设备 可读 存储 介质 | ||
本申请提供了一种模型的训练方法,将损失函数值小于或等于第一预设阈值的预设的目标模型作为待测试模型,获取待测试模型的测试结果,当测试结果满足预设的测试条件时,将待测试模型作为预测模型,或者,当预测结果不满足测试条件时,依据测试结果,更新样本数据的影响因子。本申请实施例提供的模型训练方法可以自动控制样本数据对模型训练的影响,一方面可以避免模型在训练过程中由于样本数据分布问题引起的模型训练效果不佳,最终导致得到的预测模型的预测准确度低。另一方面,相对于现有技术中,人工清洗数据的方法,避免了漏检的情况,节省了大量的人工成本和时间。
技术领域
本申请涉及机器学习技术领域,更具体地说,涉及一种模型的训练方法、装置、设备及可读存储介质。
背景技术
模型训练所使用的样本数据往往参杂有脏数据或缺省数据,并且可能存在样本数据不均衡。现有的模型训练方法将样本数据直接用于机器学习任务,往往导致模型训练结果不准确,从而使训练得到的预测模型在实际预测过程中,预测结果与实际出现较大偏差。
发明内容
有鉴于此,本申请提供了一种模型的训练方法、装置、设备及可读存储介质,如下:
一种模型的训练方法,包括:
将损失函数值小于或等于第一预设阈值的预设的目标模型作为待测试模型;其中,所述损失函数值由样本数据的真实值以及所述样本数据的预设的影响因子,计算得到,所述影响因子用于表示所述样本数据的预测误差的权重值,任一所述样本数据的预测误差表示所述目标模型输出的所述样本数据的预测结果与所述样本数据的真实值之间的偏差;
获取所述待测试模型的测试结果;
当所述测试结果满足预设的测试条件时,将所述待测试模型作为预测模型;或者,当所述预测结果不满足所述测试条件时,依据所述测试结果,更新所述样本数据的所述影响因子。
可选地,在将小于或等于第一预设阈值的预设的目标模型作为待测试模型之前,还包括:
获取所述样本数据以及每一所述样本数据的所述影响因子;
将所述样本数据输入至所述目标模型;
获取所述目标模型输出的所述样本数据的预测结果;
依据所述样本数据的真实值、所述样本数据的预测结果以及所述样本数据的所述影响因子,计算所述损失函数值。
可选地,依据所述样本数据的真实值、所述样本数据的预测结果以及所述样本数据的所述影响因子,计算所述损失函数值,包括:
计算每一所述样本数据的真实值与所述样本数据的预测结果之间的偏差,作为所述样本数据的预测误差;
将每一所述样本数据的所述影响因子与所述样本数据的预测误差相乘,得到所述样本数据的预测损失值;
依据每一所述样本数据的预测损失值与预设的正则函数,计算得到所述目标模型的损失函数值。
可选地,获取所述待测试模型的测试结果,包括:
获取测试数据;
将所述测试数据输入至所述待测试模型,得到每一所述测试数据的预测结果;
依据每一所述测试数据的预测结果,计算所述待测试模型的测试结果,所述测试结果至少包括查准率和查全率。
可选地,预设的测试条件至少包括第一测试条件和第二测试条件,所述第一测试条件为,所述查全率大于第二预设阈值,所述第二测试条件为,所述查准率大于第三预设阈值。
可选地,依据所述测试结果,更新所述样本数据的所述影响因子,至少包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269451.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带有多级控温结构的中药材干燥设备
- 下一篇:一种阀段试验平台