[发明专利]一种反洗钱模型的训练方法及装置有效
| 申请号: | 201911394159.5 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111145026B | 公开(公告)日: | 2023-05-09 |
| 发明(设计)人: | 刘正夫 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q40/06;G06F18/2431;G06F18/21;G06F18/214;G06N20/20;G06N5/01;G06N3/096;G06N3/091;G06N3/082;G06N3/045;G06N3/08;G06N5/00 |
| 代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 任媛;刘铁生 |
| 地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 洗钱 模型 训练 方法 装置 | ||
1.一种反洗钱模型的训练方法,其特征在于,包括:
获取交易样本数据集,所述交易样本数据集中包括多个具有多分类标签的交易样本数据,其中,所述多分类标签用于标识所述交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为;
基于所述交易样本数据集训练老师模型;
获取多个温度参数值;
对于每个所述温度参数值:利用该温度参数值调整训练完成的老师模型后,利用老师模型对所述交易样本数据集进行预测,得到各所述交易样本数据分别对应的预测值;用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签,得到新的交易样本数据集;用所述新的交易样本数据集训练学生模型;其中,不同的温度参数值下,训练出不同的学生模型,且训练出的不同的学生模型具有不同的反洗钱能力;
集成多个训练后的学生模型形成反洗钱模型;
获取多个温度参数值,包括:
确定温度参数值的获取次数;温度参数值的获取次数与温度参数值的数量相同;
对于每次获取均执行如下步骤:从预设的抽样方法集中选取抽样方法,利用所述抽样方法从预设的抽样数据集中抽取N个抽样数据;确定所述N个抽样数据在学生模型上的评价指标;对应组合N个抽样数据及其各自对应的评价指标,形成初始数据;对所述初始数据进行贝叶斯优化,得到所述温度参数值;
其中,每次温度参数值的获取过程中,从所述抽样方法集中选取的抽样方法均不相同。
2.根据权利要求1所述的方法,其特征在于,确定所述N个抽样数据在学生模型上的评价指标,包括:
将所述N个抽样数据划分为训练集和测试集;
基于所述训练集训练所述学生模型;
获取训练后的学生模型在所述测试集上的预测结果,将所述预测结果确定为所述评价指标。
3.根据权利要求1所述的方法,其特征在于,所述抽样方法集包括如下方法中的至少一种:基于正态分布的抽样方法、基于均匀分布的抽样方法和基于指数分布的抽样方法。
4.根据权利要求1所述的方法,其特征在于,利用该温度参数调整训练完成的老师模型后,利用老师模型对所述交易样本数据集进行预测,得到各所述交易样本数据分别对应的预测值,包括:
利用老师模型对所述交易样本数据集进行预测,得到各交易样本数据的预测结果,其中,所述预测结果为所述老师模型对多分类的预测结果;
基于该温度参数,对各交易样本数据的预测结果进行归一化处理,得到各所述交易样本数据分别对应的预测值。
5.根据权利要求4所述的方法,其特征在于,基于该温度参数,对各交易样本数据的预测结果进行归一化处理,得到各所述交易样本数据分别对应的预测值,包括:
对于每一个所述交易样本数据:通过第一公式,对该交易样本数据的预测结果进行归一化处理,确定该交易样本数据的预测结果中的各分类的预测值;组合预测结果中的各分类的预测值,得到该交易样本数据的预测值;
所述第一公式为:
其中,所述qi表征交易样本数据的预测结果中针对第i个分类的预测值;所述j表征交易样本数据的预测结果中所涉及的所有分类的总数量;所述zj表征交易样本数据的预测结果中所涉及的所有分类中第j个分类的预测结果;T表征当前温度参数值;exp表征以自然数e为底的指数函数。
6.根据权利要求1-5中任一所述的方法,其特征在于,基于所述交易样本数据集训练老师模型,包括:
对所述交易样本数据集中各交易样本数据的多分类标签进行离散化处理,得到各所述交易样本数据的离散化标签;
利用具有离散化标签的各交易样本数据训练所述老师模型。
7.根据权利要求1-5中任一所述的方法,其特征在于,在基于所述交易样本数据集训练老师模型之后,所述方法还包括:
对基于所述交易样本数据集训练的老师模型进行裁剪处理,将裁剪处理后的老师模型确定为训练完成的老师模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911394159.5/1.html,转载请声明来源钻瓜专利网。





