[发明专利]基于知识图谱查询金融异常数据的方法及系统在审
申请号: | 201811588282.6 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109491995A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 鲁岑 | 申请(专利权)人: | 苏宁易购集团股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/28;G06Q40/02 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常数据 图谱 图谱数据库 样本数据 查询 金融 节点间关系 金融数据 数据清洗 需求设计 样本源 采集 查找 输出 | ||
1.一种基于知识图谱查询金融异常数据的方法,其特征在于,包括:
根据金融异常数据的查询需求设计图谱数据库的结构构成,所述结构构成包括节点及节点间关系的表述;
采集多个样本源数据,对其数据清洗后得到多个符合图谱数据库结构构成的样本数据;
将所述样本数据导入所述图谱数据库输出知识图谱,然后从所述知识图谱中查找出金融异常数据。
2.根据权利要求1所述的方法,其特征在于,根据金融异常数据的查询需求设计图谱数据库的结构构成的方法包括:
所述金融异常数据的查询需求包括从多位贷款人登记信息中查找出非法中介人信息,所述贷款人登记信息包括贷款人信息、联系人信息、转账人信息和/或收件人信息,其中,所述信息包括姓名数据、电话数据和身份识别码数据;
基于多种数据类型对应设置多种节点类型,按照一节点对应一数据的原则设计图谱数据库。
3.根据权利要求2所述的方法,其特征在于,所述采集多个样本源数据,对其数据清洗后得到多个符合图谱数据库结构构成的样本数据的方法包括:
从数据库中获取多份贷款人登记信息,并从中提取每份贷款人登记信息中的贷款人信息、联系人信息、转账人信息和/或收件人信息作为样本源数据;
对所述样本源数据初步筛查,剔除不包括姓名数据、电话数据或身份识别码数据的样本源数据;
对保留下的样本源数据进行查重,删除重复的样本源数据;
将查重后的样本源数据进行合法性校验,去除电话数据和/或身份识别码数据无效的样本源数据,最终保留有效的样本数据。
4.根据权利要求3所述的方法,其特征在于,所述电话数据和/或身份识别码数据无效的识别方法为:
通过比对电话数据和/或身份识别码数据与标准电话号码和/或标准身份识别码的长度是否一致来判断是否无效。
5.根据权利要求2所述的方法,其特征在于,从所述知识图谱中识别出金融异常数据的方法包括:
采用Cypher语言预设多种金融异常数据查询语句,包括异常姓名查询语句、异常电话查询语句或异常身份识别码查询语句;
将异常姓名查询语句、异常电话查询语句或异常身份识别码查询语句以模块化的形式设置在查询界面上,以使用户根据金融异常数据的查询需求对应选择查询语句输入;
将多个所述样本数据以节点形式分布展开,关系节点通过指示线关联形成知识图谱;
根据输入的查询语句从知识图谱中筛选出关系节点,再从筛选出的关系节点中查找出非法中介人信息。
6.根据权利要求5所述的方法,其特征在于,根据输入的查询语句从知识图谱中筛选出关系节点,再从筛选出的关系节点中查找出非法中介人信息的方法包括:
设置异常节点识别阈值,当关系节点的关联度大于所述阈值时将关系节点中与所述查询语句类型一致的节点输出,得到非法中介人信息的查询结果。
7.根据权利要求5或6所述的方法,其特征在于,所述关联度是根据与节点连接的指示线数量定义得到的。
8.一种基于知识图谱查询金融异常数据系统,其特征在于,包括:
图谱设计单元,用于根据金融异常数据的查询需求设计图谱数据库的结构构成,所述结构构成包括节点及节点间关系的表述;
样本采集单元,用于采集多个样本源数据,对其数据清洗后得到多个符合图谱数据库结构构成的样本数据;
识别输出单元,用于将所述样本数据导入所述图谱数据库输出知识图谱,然后从所述知识图谱中查找出金融异常数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁易购集团股份有限公司,未经苏宁易购集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811588282.6/1.html,转载请声明来源钻瓜专利网。