[发明专利]一种反洗钱模型的训练方法及装置有效
| 申请号: | 201911394159.5 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111145026B | 公开(公告)日: | 2023-05-09 |
| 发明(设计)人: | 刘正夫 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q40/06;G06F18/2431;G06F18/21;G06F18/214;G06N20/20;G06N5/01;G06N3/096;G06N3/091;G06N3/082;G06N3/045;G06N3/08;G06N5/00 |
| 代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 任媛;刘铁生 |
| 地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 洗钱 模型 训练 方法 装置 | ||
本发明公开了一种反洗钱模型的训练方法及装置,涉及数据处理技术领域;主要包括:获取交易样本数据集,交易样本数据集中包括多个具有多分类标签的交易样本数据,多分类标签用于标识交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为;基于交易样本数据集训练老师模型;获取多个温度参数值;对于每个温度参数值:利用该温度参数调整训练完成的老师模型后,利用老师模型对交易样本数据集进行预测,得到各交易样本数据分别对应的预测值;用各交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签,得到新的交易样本数据集;用新的交易样本数据集训练学生模型;集成多个训练后的学生模型形成反洗钱模型。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种反洗钱模型的训练方法及装置。
背景技术
随着互联网技术的发展,金融领域的交易行为越来越多的依赖于互联网进行,但是相伴而生的洗钱行为逐渐渗入到互联网中。洗钱,是指通过合法的活动或建设将违法获得的收入隐藏、伪装或投资的过程,为了维护社会公正和打击腐败等经济犯罪,需要在互联网中进行反洗钱监控。
目前,互联网中的反洗钱监控主要通过预设的反洗钱模型对互联网数据进行识别分析,从而识别出洗钱行为。通常使用的反洗钱模型存在如下两种:一种是,数据拟合力较强的反洗钱模型,虽然这种模型的反洗钱识别能力较好,但是为了满足数据拟合能力,这种模型较为复杂。比如,这种模型选用神经网络模型时,为了增强数据拟合力,通常会对神经网络加层/节点数,这会导致神经网络的网络结构非常复杂,从而导致识别计算时间花销较大,不能满足在线模型实时性的需求。第二种,在线实时性较好的反洗钱模型,这种模型为了满足在线实时性的需求,通常用较简单的模型来拟合数据,例如随机森林,gbdt等等。这种模型虽然能满足实时性的要求,但是由于本身结构比较简单,需要开发人员为其设计大量的特征,设计耗时耗力,且反洗钱识别效果不佳。
发明内容
有鉴于此,本发明提出了一种基于知识蒸馏的反洗钱模型的训练方法方法及装置,主要目的在于训练出数据拟合能力较强,且反洗钱能力较好的反洗钱模型。
第一方面,本发明提供了一种反洗钱模型的训练方法,该方法包括:
获取交易样本数据集,所述交易样本数据集中包括多个具有多分类标签的交易样本数据,其中,所述多分类标签用于标识所述交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为;
基于所述交易样本数据集训练老师模型;
获取多个温度参数值;
对于每个所述温度参数值:利用该温度参数调整训练完成的老师模型后,利用老师模型对所述交易样本数据集进行预测,得到各所述交易样本数据分别对应的预测值;用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签,得到新的交易样本数据集;用所述新的交易样本数据集训练学生模型;
集成多个训练后的学生模型形成反洗钱模型。
第二方面,本发明提供了一种反洗钱模型的训练装置,该装置包括:
第一获取单元,用于获取交易样本数据集,所述交易样本数据集中包括多个具有多分类标签的交易样本数据,其中,所述多分类标签用于标识所述交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为;
第一训练单元,用于基于所述交易样本数据集训练老师模型;
第二获取单元,用于获取多个温度参数值;
第二训练单元,用于对于每个所述温度参数值:利用该温度参数调整训练完成的老师模型后,利用老师模型对所述交易样本数据集进行预测,得到各所述交易样本数据分别对应的预测值;用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签,得到新的交易样本数据集;用所述新的交易样本数据集训练学生模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911394159.5/2.html,转载请声明来源钻瓜专利网。





