[发明专利]用于使用字符串的频谱进行垃圾邮件检测的系统和方法在审
| 申请号: | 201280066689.7 | 申请日: | 2012-09-05 |
| 公开(公告)号: | CN104040963A | 公开(公告)日: | 2014-09-10 |
| 发明(设计)人: | 达尼埃尔·迪基乌;Z·卢奇安·卢普赛斯库 | 申请(专利权)人: | 比特梵德知识产权管理有限公司 |
| 主分类号: | H04L12/58 | 分类号: | H04L12/58 |
| 代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 张世俊 |
| 地址: | 塞浦路斯*** | 国省代码: | 塞浦路斯;CY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 使用 字符串 频谱 进行 垃圾邮件 检测 系统 方法 | ||
1.一种方法,其包括:
采用计算机系统接收形成电子通信的一部分的目标串;
采用计算机系统将所述目标串处理为由数字序列组成的目标信号,其中所述目标串的每一字符被映射到所述数字序列的一数字;
响应于接收到所述目标串,采用所述计算机系统根据所述目标串确定串合格性准则;
采用所述计算机系统根据所述串合格性准则对参考串的语料库进行预过滤,以产生多个候选串;
响应于选择所述候选串,采用所述计算机系统执行所述目标信号的频谱与针对所述多个候选串中的一候选串确定的频谱之间的比较;以及
采用所述计算机系统根据所述比较的结果确定所述电子通信是否为垃圾邮件或非垃圾邮件。
2.根据权利要求1所述的方法,其进一步包括根据所述目标串的时戳与所述候选串的时戳之间的比较确定所述电子通信是否为垃圾邮件或非垃圾邮件。
3.根据权利要求1所述的方法,其中所述参考串的语料库包括多个群集,每一群集包含一组相似串,其中所述多个候选串中的每一候选串代表一明显不同的群集,且其中所述方法进一步包括响应于执行所述比较,采用所述计算机系统从所述多个群集选择一群集且将所述目标串指派于所述选定群集。
4.根据权利要求3所述的方法,其进一步包括根据多个时戳确定所述目标通信是否为垃圾邮件或非垃圾邮件,所述多个时戳中的每一时戳对应于所述选定群集的一成员。
5.根据权利要求3所述的方法,其进一步包括:
响应于将所述目标串指派于所述选定群集,确定所述选定群集的群集成员的计数;以及
根据所述群集成员的计数确定所述目标通信是否为垃圾邮件或非垃圾邮件。
6.根据权利要求3所述的方法,其进一步包括根据所述选定群集将所述目标通信识别为属于选定垃圾邮件波。
7.根据权利要求1所述的方法,其中对所述语料库进行预过滤包括:
确定所述目标串的第一串长度和所述语料库的参考串的第二串长度,且
当所述第一串长度与所述第二串长度相差小于预定阈值的量时,将所述参考串添加到所述组候选串。
8.根据权利要求1所述的方法,其中对所述语料库进行预过滤包括:
将所述目标串的第一谱得分确定为如下函数:
其中Ai表示在频率i处确定的所述目标信号的所述频谱的振幅;
确定所述语料库的参考串的第二谱得分;以及
当所述第一谱得分与所述第二谱得分相差小于预定阈值的量时,将所述参考串添加到所述组候选串。
9.根据权利要求1所述的方法,其中执行所述比较包括将串间距离确定为如下函数:
其中i标引频率,S表示所述目标信号的所述频谱的频率子集,ATi表示频率i处所述目标信号的所述频谱的振幅,ACi表示在频率i处针对所述候选串确定的所述频谱的振幅,且其中ɑ是正常数。
10.根据权利要求9所述的方法,其中所述子集S排他地由对应于所述目标信号的所述频谱的零频率的索引i组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于比特梵德知识产权管理有限公司,未经比特梵德知识产权管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280066689.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:行星齿轮架和具有行星齿轮架的行星齿轮变速器
- 下一篇:运算放大器





