[发明专利]一种基于横向联邦学习的反洗钱识别方法、装置及系统有效
申请号: | 202110264163.0 | 申请日: | 2021-03-11 |
公开(公告)号: | CN113094407B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 武润鹏;李衡;张岩;邹杰 | 申请(专利权)人: | 广发证券股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/27;G06N20/00;G06Q40/02;G06Q40/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;颜希文 |
地址: | 510663 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 横向 联邦 学习 洗钱 识别 方法 装置 系统 | ||
本发明公开了一种基于横向联邦学习的反洗钱识别方法、装置及系统,所述方法先对各参与节点所提供的数据特征进行特征对齐,提取出用于构建反洗钱模型的基础数据特征;根据各参与节点所上传的各数据样本的用户ID以及样本生成时间进行样本同步;向各参与节点下发时序特征构造指令,构造出所需的时序特征的最终特征值,并将其下发至各个参与节点,以使各个参与节点根据获取的时序特征值结合自身的数据特征的特征值,通过横向联邦学习构建出反洗钱识别模型,最终根据所构建的反洗钱模型进行反洗钱识别。通过实施本发明实施例能够提高反洗钱识别的准确性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于横向联邦学习的反洗钱识别方法、装置及系统。
背景技术
现有基于机器学习的反洗钱判断,由各证券公司利用各自的交易数据单独训练模型,然后进行反洗钱判断;在反洗钱模型构造过程中,所需要的数据主要分为两类;一类是单一特征,这类特征值依赖于当前记录,例如客户的年纪或职业特征;另一类为时序特征,这一类特征依赖于多条记录。例如某个客户最近一个月的交易数量,这个特征就需要对客户近一个月内所有交易记录进行汇总后得到;而同一个客户在不同公司可能有不同的交易数据,不同公司的数据具有保密性无法互通,那么若仅依靠单个公司的数据来构造反洗钱模型,会因为数据不全面导致所构造的时序特征不准确,进而导致模型的准确性较低的问题,此外单个公司的历史洗钱案件数量很少,仅由一个公司的数据所构造的模型,存在过拟合现象,误差较大,
发明内容
本发明实施例提供一种基于横向联邦学习的反洗钱识别方法、装置及系统,能够提高反洗钱识别的准确性。
本发明一实施例提供一种基于横向联邦学习的反洗钱识别方法,包括:
对若干参与节点的样本数据表中各数据特征进行特征对齐,生成用于构建反洗钱模型的基础数据特征;其中,每一所述样本数据表包括若干数据样本,且每一数据样本均设置有用户ID以及样本生成时间;
根据用户ID以及样本生成时间对各所述参与节点的样本数据表进行样本同步;其中,在进行样本同步时,将当前参与节点中一选定数据样本的用户ID和样本生成时间发送至未拥有所述选定数据样本但拥有与所述选定数据样本用户ID相同的数据样本的参与节点;
向各所述参与节点下发时序特征构造指令,以使各所述参与节点在接收所述时序特征构造指令时,根据所述时序构造指令所包含的统计时间维度信息,所需的基础数据特征的特征名称以及计算方式,基于样本同步后的样本数据表计算所需构造的时序特征的基础特征值;根据各所述基础特征值,计算所述时序特征的最终特征值;
将所述时序特征的最终特征值下发至各所述参与节点,以使各所述参与节点根据所述时序特征的最终特征值以及自身的数据特征的特征值,通过横向联邦学习生成反洗钱识别模型并根据所述反洗钱识别模型进行反洗钱识别。
进一步的,所述对若干参与节点的样本数据表中各数据特征进行特征对齐,生成用于构建反洗钱模型的基础数据特征,具体包括:
取各参与节点的样本数据表中的各数据特征的特征交集,获得若干第一基础数据特征;
逐一计算除所述第一基础数据特征外的各数据特征的全局有效率;将全局有效率超过第一预设阈值的数据特征,作为第二基础数据特征;
将所有所述第一基础数据特征以及所有所述第二基础数据特征作为所述用于构建反洗钱模型的基础数据特征。
进一步的,通过以下公式计算一数据特征的全局有效率:
其中,gr为一数据特征的全局有效率、M为参与节点的数量,IrM为数据特征在第M个参与节点的局部有效率、nM为第M个参与节点的数据样本的数量。
在上述方法项实施例的基础上,本发明对应提供了装置项实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广发证券股份有限公司,未经广发证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110264163.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种会议室节能方法与装置
- 下一篇:一种医疗用X射线设备精确定位辅助装置