[发明专利]地址模糊匹配方法及装置有效

专利信息
申请号: 202010541244.6 申请日: 2020-06-15
公开(公告)号: CN111737315B 公开(公告)日: 2023-08-11
发明(设计)人: 徐琳玲;张莹;厉林晨;高峰 申请(专利权)人: 中国工商银行股份有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/29
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 王涛;汤在彦
地址: 100140 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 地址 模糊 匹配 方法 装置
【说明书】:

本申请实施例提供一种地址模糊匹配方法及装置,方法包括:分别获取标准数据块中各个目标用户各自对应的多个虚拟记录对,各个标准数据块分别用于存储前三层相同的标准地址表,各个虚拟记录对分别用于存储各自对应的用户唯一标识与对应的虚拟地址,虚拟地址预先基于位于对应的标准地址表的第四层或大于第四层的层级中的详细地址信息获取;应用各个虚拟记录对生成目标有向图;在目标有向图中进行两次传递方向相反的消息传递,得到存在相似性的各个虚拟记录对之间的地址相似度。本申请能够有效提高用户地址模糊匹配的效率,并能够有效降低用户地址模糊匹配的计算量,进而能够有效提高企业获取存在高地址相似度的用户的效率。

技术领域

本申请涉及数据处理技术领域,具体涉及地址模糊匹配方法及装置。

背景技术

随着大数据技术的发展,对用户间社会关系的分析已成为各个企业或机构等进行用户数据分析的常用技术甚至必备手段,如:银行机构在识别信用卡欺诈团伙时:同一欺诈团伙往往申请一批信用卡来套取资金,这些信用卡往往使用相同的卡片邮寄地址、公司地址等,通过建立信用卡申请客户间在地理位置信息上的关系,对于识别信用卡团伙欺诈有着重要意义。

在各个企业或机构构建其用户的社会关系的过程中,地址关系的建立至关重要,然而,对于大型银行来说,其所有用户地址的两两匹配往往面临以下耗时漫长难以满足应用性能的困难。原因如下:

1、匹配次数多:

假如银行每日出现100万个新地址信息(这些地址信息可来自于客户的交易地址、申请信用卡填写的公司地址\居住地址等),如果逐条匹配:即对每个客户均扫描一遍其余客户地址数据来得到其余所有客户的地址相似度,则需要匹配(1*106)!次,如果串行执行耗时过长难以满足银行数据分析的及时性要求。

2、匹配算法复杂:

上海市浦东新区XX路XX号与上海浦东XX路XX号是一个地址,如果采用精确匹配则不能正确反映其关系。因此,传统上往往采用各类模糊匹配算法来进行地址的模糊匹配,这些算法有时十分复杂,这样就更加剧了地址匹配的性能瓶颈。

发明内容

针对现有技术中的问题,本申请提供一种地址模糊匹配方法及装置,能够有效提高用户地址模糊匹配的效率,并能够有效降低用户地址模糊匹配的计算量,进而能够有效提高企业获取存在高地址相似度的用户的效率。

为解决上述技术问题,本申请提供以下技术方案:

第一方面,本申请提供一种地址模糊匹配方法,包括:

分别获取标准数据块中各个目标用户各自对应的多个虚拟记录对,其中,各个所述标准数据块分别用于存储前三层相同的标准地址表,各个所述虚拟记录对分别用于存储各自对应的用户唯一标识与对应的虚拟地址,且所述虚拟地址预先基于位于对应的所述标准地址表的第四层或大于第四层的层级中的详细地址信息获取;

应用各个所述虚拟记录对生成目标有向图,且该目标有向图中的各个边的起始节点为所述用户唯一标识,各个边的目的节点为对应的所述虚拟地址;

在所述目标有向图中进行两次传递方向相反的消息传递,得到存在相似性的各个所述虚拟记录对之间的地址相似度。

进一步地,所述分别获取标准数据块中各个目标用户各自对应的多个虚拟记录对,包括:

分别获取各个标准数据块各自对应的多个记录对,其中,各个所述记录对分别用于存储各自对应的用户唯一标识与对应的词向量,且该词向量为位于所述标准地址表的第四层或大于第四层的层级中的详细地址信息;

将所在层级相同的所述词向量对应的所述记录对合并至同一数据集合,并所述数据集合内的词向量进行聚类,得到至少一个词向量类;

获取各个所述词向量类的中心点向量,并将所述记录对中的所述词向量替换为对应的中心点向量,得到各个所述记录对各自对应的虚拟记录对。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010541244.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top