[发明专利]一种基于指纹型可变长布鲁姆过滤器的邮件地址匹配方法有效

专利信息
申请号: 201710158175.9 申请日: 2017-03-16
公开(公告)号: CN108632131B 公开(公告)日: 2020-10-20
发明(设计)人: 王志刚 申请(专利权)人: 哈尔滨英赛克信息技术有限公司
主分类号: H04L12/58 分类号: H04L12/58;G06F16/22;G06F16/245
代理公司: 暂无信息 代理人: 暂无信息
地址: 150001 黑龙江*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 指纹 变长 布鲁姆 过滤器 邮件地址 匹配 方法
【说明书】:

发明提供了一种基于指纹型可变长布鲁姆过滤器的邮件地址匹配方法,FPVLCBF使用一个长度为m的向量V来表示一个集合,向量V中的每一维度i由三部分构成,第一部分是分隔符占1bit,第二部分是由a bit组成的计数器,第三部分是由b bit组成的指纹位;一共需要k+1个哈希函数,前k个函数的使用方法和传统的布鲁姆过滤器一样用来计算哈希值,最后一个哈希函数用来计算一个元素的指纹值,FPVLCBF需要一个索引表来加快查找速度;将指纹的思想与计数布鲁姆过滤器的思想相结合,提出了一种基于指纹的可变长计数布鲁姆过滤器(FPVLCBF),降低了传统计数布鲁姆过滤器的假阳率,并最大程度上提高计数布鲁姆过滤器的空间效率。

技术领域

本发明涉及邮件地址过滤技术领域,尤其涉及一种基于指纹型可变长布鲁姆过滤器的邮件地址匹配方法。

背景技术

邮件地址匹配技术作为邮件网关技术中的基础发挥着重要的作用。在当今互联网日益复杂的今天,随着网络流量的逐渐增大,如何使得邮件网关在应对大流量网络时,能够拥有更高的处理速度,以及较好的内存消耗表现是当前邮件网关领域的主要需求。

目前绝大多数进行邮件地址匹配的方法选用的都是各类多模式匹配算法。以经典AC算法为例,采用AC算法进行邮件地址匹配可以获得较好的时耗上的效率。但是AC算法在模式规则集数量较大时,需要的内存比较大。在邮件地址匹配方面,邮件地址的长度基本固定在一个范围内,邮件地址过滤是在一个邮件地址集合中查找某个邮件地址是否在集合中。计数布鲁姆过滤器在此类场合中的应用比较广泛,但是计数布鲁姆过滤器的空间复杂度较高,而且假阳率也比较高。

发明内容

本发明对传统的计数布鲁姆过滤器算法进行了改进,将指纹的思想与计数布鲁姆过滤器的思想相结合,提出了一种基于指纹的可变长计数布鲁姆过滤器(FPVLCBF),降低了传统计数布鲁姆过滤器的假阳率,并最大程度上提高计数布鲁姆过滤器的空间效率。本发明非常适合用在大流量环境下的邮件地址匹配中。

为解决上述技术问题,本发明提供了1、一种基于指纹型可变长布鲁姆过滤器的邮件地址匹配方法,其特征在于,FPVLCBF使用一个长度为m的向量V来表示一个集合,向量V中的每一维度i由三部分构成,第一部分是分隔符占1bit,第二部分是由a bit组成的计数器,第三部分是由b bit组成的指纹位;一共需要k+1个哈希函数,前k个函数的使用方法和传统的布鲁姆过滤器一样用来计算哈希值,最后一个哈希函数用来计算一个元素的指纹值,FPVLCBF需要一个索引表来加快查找速度;

其中,FPVLCBF的插入步骤如下:

a)根据插入对象x,计算x的散列值hi(x),i=(1,2,3…k),并计算指纹函数值hp(x);

b)查找哈希值hi(x),i=(1,2,3…k)对应的分隔符,查找时,通过计算先在索引表中找到最后一个小于hi(x)的值,从索引表中记录的对应位的分隔符0开始,遇到0跳过b位,然后跳过若干位比特值为1的位,找到下一个0,分隔符计数值加1,按照此方法一直找到哈希值对应的分隔符;

c)跳过分隔符位,将指纹位值与特征函数的值hp(x)相异或,并将结果写回到指纹位;

d)跳过指纹位,将指纹位之后的所有比特位右移一位,增加一个bit位,并将该bit置1;

e)更新索引表;

FPVLCBF的查询步骤如下:

a)根据查询元素x,算出x的哈希函数值hi(x),i=(1,2,3…k),并计算指纹函数值hp(x);

b)查找哈希值hi(x),i=(1,2,3…k)对应的分隔符,查找时通过计算找到索引表中的最后一个小于hi(x)的值,从索引表中记录的对应位的分隔符0开始,遇到0跳过b位,然后跳过若干位比特值为1的位,找到下一个0,分隔符计数值加1,按照此方法一直找到哈希值对应的分隔符;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨英赛克信息技术有限公司,未经哈尔滨英赛克信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710158175.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top