[发明专利]一种异常交易数据的识别方法及装置在审
申请号: | 201610408006.1 | 申请日: | 2016-06-12 |
公开(公告)号: | CN106897931A | 公开(公告)日: | 2017-06-27 |
发明(设计)人: | 潘健民 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙)11348 | 代理人: | 王伟锋,刘铁生 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 异常 交易 数据 识别 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种异常交易数据的识别方法及装置。
背景技术
随着互联网金融的不断发展,互联网金融犯罪的种类也随之增加,互联网金融犯罪既包括互联网金融产品或服务可能涉嫌的犯罪,也包括利用互联网金融平台实施的犯罪。当前已有的互联网金融犯罪类型包括非法吸收公众存款、非法集资、诈骗、擅自发行股票公司企业债券、非法侵入计算机信息系统、洗钱等。互联网金融犯罪相比于传统金融犯罪具有作案方式与互联网金融业态相适应,智能化、隐蔽化的特征,并且其影响范围广、消费者权益救助难,证据存在形式隐蔽、取证难度大。
针对网络洗钱这一互联网金融犯罪类型,当前的金融机构在识别该型互联网金融犯罪时,主要依靠识别网络洗钱交易与大部分证照交易的不同点,普遍所采用的侦测方式还是通过人工设定规则的方法,例如对于某种洗钱手法,会对用户的交易行为定义如下规则:如果用户在一定时间周期内满足指标A大于m,且指标B小于n,指标C不等于x,则输出该用户,系统认为该用户是可疑用户,交给相关人员审核。
而通过人工设定规则的方法检测异常交易行为,则存在有如下缺点:
(1)相关指标阈值由人工设定,只要低于某一个条件的阈值,该用户就不会被判定可疑,阈值很难精确设定导致检测结果准确率降低。
(2)通过人工设定规则,只能组合有限的几个指标集合,很难发挥出大数据海量指标集的优势。
(3)规则设定需要人工修改,无法通过已有的已判定的案例数据,对未来规则提供规则调整建议,很难起到量化作用。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种异常交易数据的识别方法及装置,通过大量的判断指标对交易数据进行综合量化打分,以此细化交易数据的异常指数,从而提高异常交易数据判断的准确性。
为达到上述目的,本发明主要提供如下技术方案:
一方面,本发明提供一种异常交易数据的识别方法,该方法应用于计算机设备,该方法包括:
基于已识别样本数据集中的交易数据计算所述已识别样本数据集中指标的指标权重,所述指标权重表示所述指标对所述已识别样本数据集中异常交易数据的区分程度;
利用加权分隔森林算法以及所述指标权重对待识别交易数据进行处理得到所述待识别数据对应的可疑分数值;
当所述可疑分数值大于预置分数时,确定所述待识别交易数据为异常交易数据。
另一方面,本发明提供一种异常交易数据的识别装置,该装置设置于应用异常交易数据的识别方法的计算机设备中,该装置包括:
计算单元,用于基于已识别样本数据集中的交易数据计算所述已识别样本数据集中指标的指标权重,所述指标权重表示所述指标对所述已识别样本数据集中异常交易数据的区分程度;
处理单元,用于利用加权分隔森林算法以及所述计算单元计算的指标权重对待识别数据进行处理得到所述待识别数据对应的可疑分数值;
判断单元,用于当所述处理单元得到的可疑分数值大于预置分数时,确定所述待识别交易数据为异常交易数据。
借由上述技术方案,本发明提供的一种异常交易数据的识别方法及装置,是通过整理已被识别的样本数据来确定数据所包含的各个指标在所有指标中的权重值,再根据得到的指标权重对待识别交易数据进行计算处理得到一个用于表示该数据是异常交易数据的可疑分数值,在该可疑分数值达到某一预置值时确定该待识别交易数据为异常交易数据,并输出显示以供系统对该异常交易数据进行进一步的核实分析。相对于现有的识别交易异常交易数据的方法,该方法通过计算所有指标的权重来综合分析待识别交易数据,并得出一个量化分数来衡量该数据的异常指数,避免了由人工设定指标所产生的判断不全面,准确率低下的问题。同时,随着已识别样本量的增加,数据指标的权重也会随之改变,导致得到的可以分数产生变化,如此,在判断待识别交易数据的可疑性时,其识别结果会随样本数据量的增加而改变,也就是说,本方法通过对大量已识别数据的训练与学习能够提高对待识别交易数据的判断准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610408006.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子票务处理系统
- 下一篇:在线用电成本控制系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置