[发明专利]一种模型训练的方法、识别信息的方法及装置在审
| 申请号: | 202210424790.0 | 申请日: | 2022-04-21 |
| 公开(公告)号: | CN114912513A | 公开(公告)日: | 2022-08-16 |
| 发明(设计)人: | 马放;任磊;张辰;王金刚;武威 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 邓超 |
| 地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 模型 训练 方法 识别 信息 装置 | ||
本说明书公开了一种模型训练的方法、识别信息的方法及装置,首先,获取验证集。其次,将每个验证样本输入到训练后的预测模型中,预测每个验证样本对应的预测结果。而后,针对验证集中的每个验证样本,根据该验证样本对应的预测结果与该验证样本对应的标签之间的偏差,确定该验证样本对应的标签为正确标签的置信度。然后,根据每个验证样本对应的置信度,从验证集中去除置信度小于设定置信度的验证样本,得到优化后的验证集。最后,根据优化后的验证集,对训练后的预测模型进行验证。本方法可以根据优化后的验证集,对训练后的预测模型进行验证,判断预测模型的模型性能的强弱,以更新预测模型的模型参数,提高预测模型的预测结果的准确率。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种模型训练的方法、识别信息的方法及装置。
背景技术
目前,在预测模型训练的过程中,许多大规模数据集是通过搜索引擎或网络爬虫进行获取的,这些数据集中存在训练样本的标签出现错误的情况。但是,预测模型仍然会学习这些具有错误标签的训练样本,预测模型会过度拟合这些具有错误标签的训练样本,导致预测模型的预测结果的准确率较低。
因此,如何能够提高预测模型的预测结果的准确率,则是一个亟待解决的问题。
发明内容
本说明书提供一种模型训练的方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种模型训练的方法,包括:
获取验证集;
将所述验证集中包含的每个验证样本输入到训练后的预测模型中,预测所述验证集中的每个验证样本对应的预测结果;
针对所述验证集中的每个验证样本,根据该验证样本对应的预测结果与该验证样本对应的标签之间的偏差,确定该验证样本对应的标签为正确标签的置信度,作为该验证样本对应的置信度;
根据每个验证样本对应的置信度,从所述验证集中去除置信度小于设定置信度的验证样本,得到优化后的验证集;
根据所述优化后的验证集,对所述训练后的预测模型进行验证。
可选地,训练预测模型,具体包括:
获取训练集;
将所述训练集中包含的每个训练样本输入到待训练的预测模型中,预测所述训练集中的每个训练样本对应的预测结果;
针对所述训练集中的每个训练样本,根据所述训练集中的每个训练样本对应的预测结果,确定所述训练集中的每个训练样本对应的损失,以最小化该训练样本对应的损失为优化目标,对预测模型进行训练。
可选地,针对所述验证集中的每个验证样本,根据该验证样本对应的预测结果与该验证样本对应的标签之间的偏差,确定该验证样本对应的标签为正确标签的置信度,作为该验证样本对应的置信度,具体包括:
针对所述验证集中的每个验证样本,将该验证样本对应的预测结果与该验证样本对应的标签之间的偏差输入到预先训练的分类模型中,确定该验证样本对应的标签为正确标签的置信度,作为该验证样本对应的置信度。
可选地,根据所述优化后的验证集,对所述训练后的预测模型进行验证,具体包括:
根据所述训练后的预测模型确定出的所述优化后的验证集中每个验证样本对应的预测结果,以及所述优化后的验证集中的每个验证样本对应的标签,确定所述训练后的预测模型对应的预测准确率;
针对所述优化后的验证集中的每个验证样本,根据该验证样本对应的预测结果与该验证样本对应的标签之间的偏差,确定该验证样本对应的标签为正确标签的置信度,作为优化后的验证集中的该验证样本对应的置信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210424790.0/2.html,转载请声明来源钻瓜专利网。





