[发明专利]一种字符串匹配方法及装置有效
| 申请号: | 201910221366.4 | 申请日: | 2019-03-22 |
| 公开(公告)号: | CN109933644B | 公开(公告)日: | 2021-03-09 |
| 发明(设计)人: | 郭会;王宏亮 | 申请(专利权)人: | 中国农业银行股份有限公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 100005 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 字符串 匹配 方法 装置 | ||
本申请提供了一种字符串匹配方法及装置,方法包括:分别构建可疑集合中各个字符串的键值对,并分别计算各个键值对中关键字的哈希索引;获取待匹配字符串,并将待匹配字符串切分为目标长度的字符,作为目标字符;分别计算各个目标字符的哈希索引;在所述键值对中关键字的哈希索引中判断是否存在与目标字符的哈希索引相同的哈希索引;若存在,则确定匹配成功;若不存在,则调整目标长度,并返回执行将目标字符串切分为目标长度的字符,作为目标字符的步骤,直至目标长度小于设定值。在本申请中,通过以上方式可以缩短匹配时间,提高交易效率。
技术领域
本申请涉及金融技术领域,特别涉及一种字符串匹配方法及装置。
背景技术
在实时反欺诈等风控领域,在交易发起后,需在给定的可疑集合(如,公安部公布的涉恐名单、最高法公布的失信名单、银行大数据生成的欺诈可疑名单)中对交易部分关键信息(如姓名等)进行匹配,并及时返回匹配得分情况,便于风险评估。
但是,可疑集合中的可疑信息往往在百万条以上,需要遍历可疑集合中的可疑信息进行匹配,所需时间较长,影响交易效率。
发明内容
为解决上述技术问题,本申请实施例提供一种字符串匹配方法及装置,以达到缩短匹配时间,提高交易效率的目的,技术方案如下:
一种字符串匹配方法,包括:
分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引;
获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;
分别计算各个所述目标字符的哈希索引;
在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引;
若存在,则确定匹配成功;
若不存在,则调整所述目标长度,并返回执行将所述目标字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值。
优选的,所述分别构建可疑集合中各个字符串的键值对,包括:
分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串;
分别构建各个所述目标字符串的键值对;
所述获取待匹配字符串之后,还包括:
去除所述待匹配字符串中的干扰元素。
优选的,所述分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引,包括:
加载所述可疑集合至redis中;
在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
优选的,所述将所述待匹配字符串切分为目标长度的字符,包括:
利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
一种字符串匹配装置,包括:
第一计算模块,用于分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引;
切分模块,用于获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;
第二计算模块,用于分别计算各个所述目标字符的哈希索引;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910221366.4/2.html,转载请声明来源钻瓜专利网。





