[发明专利]一种字符串匹配方法及装置有效
| 申请号: | 201910221366.4 | 申请日: | 2019-03-22 |
| 公开(公告)号: | CN109933644B | 公开(公告)日: | 2021-03-09 |
| 发明(设计)人: | 郭会;王宏亮 | 申请(专利权)人: | 中国农业银行股份有限公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 100005 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 字符串 匹配 方法 装置 | ||
1.一种字符串匹配方法,其特征在于,包括:
分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引;所述分别构建可疑集合中各个字符串的键值对,包括:从字符串中提取关键信息,作为关键字;将所述字符串作为值;将所述关键字与所述值的对应关系作为所述键值对;
获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;
分别计算各个所述目标字符的哈希索引;
在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引;
若存在,则确定匹配成功;
若不存在,则调整所述目标长度,并返回执行将所述待匹配字符串切分为目标长度的字符,作为目标字符的步骤,直至所述目标长度小于设定值。
2.根据权利要求1所述的方法,其特征在于,所述分别构建可疑集合中各个字符串的键值对,包括:
分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串;
分别构建各个所述目标字符串的键值对;
所述获取待匹配字符串之后,还包括:
去除所述待匹配字符串中的干扰元素。
3.根据权利要求1所述的方法,其特征在于,所述分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引,包括:
加载所述可疑集合至redis中;
在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
4.根据权利要求1所述的方法,其特征在于,所述将所述待匹配字符串切分为目标长度的字符,包括:
利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
5.一种字符串匹配装置,其特征在于,包括:
第一计算模块,用于分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引;所述分别构建可疑集合中各个字符串的键值对,包括:从字符串中提取关键信息,作为关键字;将所述字符串作为值;将所述关键字与所述值的对应关系作为所述键值对;
切分模块,用于获取待匹配字符串,并将所述待匹配字符串切分为目标长度的字符,作为目标字符;
第二计算模块,用于分别计算各个所述目标字符的哈希索引;
判断模块,用于在所述键值对中关键字的哈希索引中判断是否存在与所述目标字符的哈希索引相同的哈希索引,若存在,则执行第二确定模块,若不存在,则执行调整模块;
第一确定模块,用于确定匹配成功;
所述调整模块,用于调整所述目标长度,并返回执行所述切分模块将所述待匹配字符串切分为目标长度的字符,作为目标字符,直至所述目标长度小于设定值。
6.根据权利要求5所述的装置,其特征在于,所述第一计算模块,包括:
第一去除子模块,用于分别去除所述可疑集合中各个字符串中的干扰元素,并将去除干扰元素的字符串作为目标字符串;
第一构建子模块,用于分别构建各个所述目标字符串的键值对;
所述切分模块,包括:
第二去除子模块,用于获取待匹配字符串之后,去除所述待匹配字符串中的干扰元素。
7.根据权利要求5所述的装置,其特征在于,所述第一计算模块,包括:
加载子模块,用于加载所述可疑集合至redis中;
计算子模块,用于在所述redis中分别构建可疑集合中各个字符串的键值对,并分别计算各个所述键值对中关键字的哈希索引。
8.根据权利要求5所述的装置,其特征在于,所述切分模块,包括:
切分子模块,用于利用所述目标长度的滑动窗口,按照设定大小的步长在所述待匹配字符串中滑动,将所述待匹配字符串切分为目标长度的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910221366.4/1.html,转载请声明来源钻瓜专利网。





