[发明专利]资源审核模型的训练方法、装置、服务器和存储介质在审
申请号: | 202011139701.5 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112287793A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 易帆;张壮辉 | 申请(专利权)人: | 有半岛(北京)信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 审核 模型 训练 方法 装置 服务器 存储 介质 | ||
1.一种资源审核模型的训练方法,其特征在于,包括:
确定预先训练的基准审核模型;
采用所述基准审核模型的原训练样本,以及从候选资源集中动态挖掘的调优样本,对所述基准审核模型不断进行调优,直至调优后的基准审核模型满足预设调优收敛条件,则将最终调优后的基准审核模型作为资源审核模型,所述调优样本为对所述基准审核模型的高违规审核存在正向影响的候选资源。
2.根据权利要求1所述的方法,其特征在于,所述采用所述基准审核模型的原训练样本,以及从候选资源集中动态挖掘的调优样本,对所述基准审核模型不断进行调优,包括:
针对每次调优后的基准审核模型,基于该基准审核模型内动态设置的高违规阈值,从所述候选资源集中挖掘对应的调优样本;
采用该基准审核模型的原训练样本和动态挖掘出的调优样本,继续对该基准审核模型进行高违规审核下的调优。
3.根据权利要求2所述的方法,其特征在于,所述基于该基准审核模型内动态设置的高违规阈值,从所述候选资源集中挖掘对应的调优样本,包括:
将所述候选资源集输入到该基准审核模型中,得到各候选资源的违规得分;
将所述违规得分大于等于该基准审核模型内动态设置的高违规阈值的候选资源作为所述调优样本,并确定所述调优样本的标签类别。
4.根据权利要求3所述的方法,其特征在于,所述确定所述调优样本的标签类别,包括:
按照所述调优样本的候选标签设置对应的标签类别;或者,
将所述调优样本推送给人工审核平台,以人工设置所述调优样本的标签类别。
5.根据权利要求2所述的方法,其特征在于,在基于该基准审核模型内动态设置的高违规阈值,从所述候选资源集中挖掘对应的调优样本之前,还包括:
针对每次调优后的基准审核模型,按照前次挖掘出的调优样本数量自适应动态调整该基准审核模型内的高违规阈值。
6.根据权利要求2所述的方法,其特征在于,在基于该基准审核模型内动态设置的高违规阈值,从所述候选资源集中挖掘对应的调优样本之后,还包括:
针对每次调优后的基准审核模型,将当前挖掘出的调优样本添加到预先构建的样本挖掘库中;
相应的,采用该基准审核模型的原训练样本和动态挖掘出的调优样本,继续对该基准审核模型进行高违规审核下的调优,包括:
采用由该基准审核模型的原训练样本和所述样本挖掘库共同组成的混合样本,继续对该基准审核模型进行高违规审核下的调优。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述预设调优收敛条件为利用调优后的基准审核模型当前挖掘出的调优样本数量低于预设挖掘阈值,或者调优后的基准审核模型在高违规审核下的训练损失达到收敛。
8.根据权利要求1-6任一项所述的方法,其特征在于,所述基准审核模型通过执行如下步骤进行预先训练:
将所述原训练样本划分为对应的训练集和验证集;
在利用所述训练集按照预设训练策略每次训练神经网络模型时,采用当前训练的神经网络模型对所述验证集进行违规审核;
按照所述训练集和所述验证集在每次训练的神经网络模型下的违规审核准确率差异,以及每次训练的神经网络模型的收敛状态,筛选出对应的基准审核模型。
9.根据权利要求8所述的方法,其特征在于,所述预设训练策略包括数据增强算法、学习率动态调整方式和权重衰减正则化算法。
10.根据权利要求1-6任一项所述的方法,其特征在于,在将最终调优后的基准审核模型作为资源审核模型之后,还包括:
线上发布所述资源审核模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有半岛(北京)信息科技有限公司,未经有半岛(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011139701.5/1.html,转载请声明来源钻瓜专利网。