[发明专利]分类模型的训练方法、预测方法及装置有效
申请号: | 201910512732.1 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110363302B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 张雅淋;李龙飞 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F18/241 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉 |
地址: | 英属开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 预测 装置 | ||
1.一种用于确定样本分类模型的方法,包括:
在交易异常检测的应用场景中,利用训练样本数据集来训练出第一数目个第一分类子模型;
使用所述第一数目个第一分类子模型来分别对测试样本数据集中的每个测试样本数据进行预测,以得到每个测试样本数据在各个第一分类子模型下的分类预测值;
执行下述循环过程,直到满足循环结束条件:
针对当前模型加权因子池中的每个模型加权因子组,基于所述测试样本数据集中的每个测试样本数据在各个第一分类子模型下的分类预测值以及该模型加权因子组中对应的模型加权因子,确定候选样本分类模型在该模型加权因子组下的模型性能评估值,所述候选样本分类模型由所述第一数目个第一分类子模型组成,每个模型加权因子组包括所述第一数目个模型加权因子,每个模型加权因子对应于一个第一分类子模型,以及每个模型加权因子组中的模型加权因子之和等于1;
在未满足所述循环结束条件时,使用遗传算法来对所述当前模型加权因子池进行更新,以得到更新后的模型加权因子池,其中,所述更新后的模型加权因子池被提供来作为下一循环过程的当前模型加权因子池;以及
基于所确定出的各个模型加权因子组下的模型性能评估值,从所述第一数目个第一分类子模型中确定出组成所述样本分类模型的第二分类子模型以及对应的预测加权因子,
其中,所述样本分类模型应用于所述交易异常检测中的非法账户检测或者欺诈交易检测,每个预测加权因子用于反映出对应的第二分类子模型针对非法账户检测或者欺诈交易检测的检测效果。
2.如权利要求1所述的方法,其中,所述候选样本分类模型的模型性能评估值确定过程是针对所述当前模型加权因子池中的每个未处理模型加权因子组执行的。
3.如权利要求1所述的方法,其中,所述循环结束条件为以下条件中的一种:
达到预定循环次数;
所述当前模型加权因子池中的模型加权因子组的数量达到预设数量。
4.如权利要求1所述的方法,其中,基于所确定出的各个模型加权因子组下的模型性能评估值,从所述第一数目个第一分类子模型中确定出组成所述样本分类模型的第二分类子模型以及对应的预测加权因子包括:
基于所确定出的各个模型加权因子组下的模型性能评估值,从所述当前模型加权因子池中选择模型性能评估值最佳的模型加权因子组;以及
将所述第一数目个第一分类子模型确定为所述样本分类模型的第二分类子模型,并且将所选择的模型加权因子组的模型加权因子确定为对应的第二分类子模型的模型加权因子。
5.如权利要求1所述的方法,其中,基于所确定出的各个模型加权因子组下的模型性能评估值,从所述第一数目个第一分类子模型中确定出组成所述样本分类模型的第二分类子模型以及对应的预测加权因子包括:
基于所确定出的各个模型加权因子组下的模型性能评估值,从所述当前模型加权因子池中选择模型性能评估值最佳的模型加权因子组;
基于所选择的模型加权因子组中的各个模型加权因子,从所述第一数目个第一分类子模型中确定出组成所述样本分类模型的第二分类子模型;以及
对被确定为第二分类子模型的各个第一分类子模型的模型加权因子进行归一化处理,以得到对应的第二分类子模型的模型加权因子。
6.如权利要求5所述的方法,其中,基于所选择的模型加权因子组中的各个模型加权因子,从所述第一数目个第一分类子模型中确定出组成所述样本分类模型的第二分类子模型包括:
从所述第一数目个第一分类子模型中选取模型加权因子大于预定阈值的第一分类子模型作为所述第二分类子模型。
7.如权利要求1到6中任一所述的方法,其中,所述遗传算法包括变异算法和交叉算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910512732.1/1.html,转载请声明来源钻瓜专利网。