[发明专利]基于知识图谱查询金融异常数据的方法及系统在审
申请号: | 201811588282.6 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109491995A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 鲁岑 | 申请(专利权)人: | 苏宁易购集团股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/28;G06Q40/02 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常数据 图谱 图谱数据库 样本数据 查询 金融 节点间关系 金融数据 数据清洗 需求设计 样本源 采集 查找 输出 | ||
本发明公开一种基于知识图谱查询金融异常数据的方法及系统,采用知识图谱的方式准确、快速的识别出其中的异常金融数据。该方法包括:根据金融异常数据的查询需求设计图谱数据库的结构构成,所述结构构成包括节点及节点间关系的表述;采集多个样本源数据,对其数据清洗后得到多个符合图谱数据库结构构成的样本数据;将所述样本数据导入所述图谱数据库输出知识图谱,然后从所述知识图谱中查找出金融异常数据。该系统包括上述技术方案所提的方法。
技术领域
本发明涉及金融反欺诈技术领域,尤其涉及一种基于知识图谱查询金融异常数据的方法及系统。
背景技术
随着互联网金融的发展,贷款中介行业逐渐兴起,他们能给征信黑户、征信白户等平时很难得到贷款审批的人群包装用户材料,帮助他们巧妙地规避平台风控,而由于此类客户多是无正常还款能力的客户,故若放款成功可能会给金融平台造成坏账,导致金融平台的资产损失,因此,为了杜绝上述欺诈行为的发生,如何识别出欺诈行为至关重要。
现有技术主要采取电话回访或者身份二次确认的方式来识别欺诈行为,实际应用中发现,上述方式对于简答的欺诈行为可以起到一定的识别效果,但对于精心包装的欺诈行为来说,由于其涉及到复杂的关系网络,很难在通过电话回访或者身份二次确认的方式准确识别,所以这也给欺诈行为识别带来了新的挑战。
发明内容
本发明的目的在于提供一种基于知识图谱查询金融异常数据的方法及系统,采用知识图谱的方式准确、快速的识别出其中的异常金融数据。
为了实现上述目的,本发明的一方面提供一种基于知识图谱查询金融异常数据的方法,包括:
根据金融异常数据的查询需求设计图谱数据库的结构构成,所述结构构成包括节点及节点间关系的表述;
采集多个样本源数据,对其数据清洗后得到多个符合图谱数据库结构构成的样本数据;
将所述样本数据导入所述图谱数据库输出知识图谱,然后从所述知识图谱中查找出金融异常数据。
优选地,根据金融异常数据的查询需求设计图谱数据库的结构构成的方法包括:
所述金融异常数据的查询需求包括从多位贷款人登记信息中查找出非法中介人信息,所述贷款人登记信息包括贷款人信息、联系人信息、转账人信息和/或收件人信息,其中,所述信息包括姓名数据、电话数据和身份识别码数据;
基于多种数据类型对应设置多种节点类型,按照一节点对应一数据的原则设计图谱数据库。
较佳地,所述采集多个样本源数据,对其数据清洗后得到多个符合图谱数据库结构构成的样本数据的方法包括:
从数据库中获取多份贷款人登记信息,并从中提取每份贷款人登记信息中的贷款人信息、联系人信息、转账人信息和/或收件人信息作为样本源数据;
对所述样本源数据初步筛查,剔除不包括姓名数据、电话数据或身份识别码数据的样本源数据;
对保留下的样本源数据进行查重,删除重复的样本源数据;
将查重后的样本源数据进行合法性校验,去除电话数据和/或身份识别码数据无效的样本源数据,最终保留有效的样本数据。
可选地,所述电话数据和/或身份识别码数据无效的识别方法为:
通过比对电话数据和/或身份识别码数据与标准电话号码和/或标准身份识别码的长度是否一致来判断是否无效。
优选地,从所述知识图谱中识别出金融异常数据的方法包括:
采用Cypher语言预设多种金融异常数据查询语句,包括异常姓名查询语句、异常电话查询语句或异常身份识别码查询语句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁易购集团股份有限公司,未经苏宁易购集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811588282.6/2.html,转载请声明来源钻瓜专利网。