[发明专利]一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法在审

专利信息
申请号: 202011267511.1 申请日: 2020-11-13
公开(公告)号: CN112256769A 公开(公告)日: 2021-01-22
发明(设计)人: 庞明宇 申请(专利权)人: 北京海致星图科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06Q40/02;G06Q40/04
代理公司: 北京成实知识产权代理有限公司 11724 代理人: 张焱
地址: 100089 北京市石景*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 pregel 实现 挖掘 商业银行 交易 数据 资金 分布 方法
【说明书】:

发明公开了一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法,包括如下步骤:步骤1:以转账交易数据构建边,形成一个资金交易的有向图;步骤2:设计一种对适配性强的迭代算法,并基于spark的pregel引擎实现,以此找出成环的资金流向。本发明解决了在利用传统方法求解资金圈形态时,由于潜在的数据倾斜导致性能不佳的问题。本发明方法依旧采用逐层迭代,但不再需要多次大表join,解决了传统做法由于多次join,代码冗余,且不能灵活跟随资金圈的节点个数的问题。本发明在代码完成后,能够支持不改变原有任何代码逻辑,将代码打包,并且只需要在配置文件中配置层次参数,就能动态实现寻找k个节点的资金圈,这更适合真实业务场景,提升效率。

技术领域

本发明涉及经济风险分析技术领域,更具体地说,它涉及一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法。

背景技术

在审计领域里,资金交易分析为其必不可少的一个部分。而资金交易又存在种种形态,比如担保圈,资金圈等。其中,资金圈形态主要指,客户与第三方的资金多次交易,并且相邻两笔交易之间存在一定的约束关系,并最终回流到自身的情况。资金圈形态的出现代表着该链路所形成的社区客户,存在某种非法交易,特殊交易的可能,因而具有审计的需要,以规避可能出现的经济风险。

目前挖掘资金圈以寻找资金流向的具体形态为思路,传统方法以穷举,hivesql或者sparksql遍历为主,但总的来说,该种手段过于复杂,计算量大,且不够灵活,很难做到适配化。比如,

1.资金转账表一般量级很大,用sql去追踪资金交易时,其实就是寻找类似a-b-c的链路,这种实现通过sqljoin来实现。但两大表的join操作会导致笛卡尔积的产生。并且资金圈一般链路较长,因而随着链路变长,会产生多次笛卡尔积。并且,由于资金转账涉及多种业务类型,所以存在着银行业务里最为夸张的数据倾斜(比如多个子公司向母公司转账)。交易数据量巨大,多重笛卡尔积,数据倾斜,这三者对系统内存容量提出了极高的要求。而且运行风险不好评估,难以确保代码能顺利跑通。

2.传统的利用sql来寻找资金圈的办法,很难做到很灵活,例如,比如资金圈历经10个实体,则sql要写9次。如果要找出历经12个实体的,则要写11次sql。这会导致很多重复工作,代码冗长。

基于上面这些存在问题,本发明设计了一种新型的寻找资金圈的办法。该方法放弃sql思路,将所有转账数据构建为一张有向图,并利用pregel框架,分布式迭代遍历有向图中所有边,迭代遍历方向按照业务实际需求而定。该种方法可以解决sql思路下计算量过大,且由于数据倾斜普遍存在而导致的性能不佳的问题。

发明内容

针对现有技术存在的不足,本发明的目的在于提供一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法,其以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供了如下技术方案:

一种基于Pregel的实现挖掘商业银行交易数据的资金圈分布的方法,其特征在于:包括如下步骤:

步骤1:以转账交易数据构建边,形成一个有向图,图中每一条边都是一个转账交易行为,边的表达形式如下:(a,b,attrs),整个有向图的数学形式为:[(srcId,srcAttr),(dstId,dstAttr),(attr)];

其中a,b代表企业实体,attrs代表a和b转账行为的自有属性;

其中,srcId为a转账方节点id;

其中,srcAttr为a转账方节点自身属性;

其中,dstId为b转账方节点id;

其中,dstAttr为b转账方节点自身属性;

其中,attr为转账属性

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海致星图科技有限公司,未经北京海致星图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011267511.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top