[发明专利]一种垃圾短信识别方法与系统在审
| 申请号: | 201410854776.X | 申请日: | 2014-12-31 |
| 公开(公告)号: | CN104602206A | 公开(公告)日: | 2015-05-06 |
| 发明(设计)人: | 黃筱芬;夏天;高金容;曾斯生;胡玉龙 | 申请(专利权)人: | 上海大汉三通通信股份有限公司 |
| 主分类号: | H04W4/14 | 分类号: | H04W4/14;G06F17/30 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
| 地址: | 201203 上海市浦东新区张*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种垃圾短信识别方法和系统,检索垃圾短信关键词时以字为单位,实现了从数量众多的有序规则中包含的数量庞大的关键词的处理,简化到有限的字的处理,通过在关键词库数据结构中逐层匹配得到关键词,短信中关键词的查找借助根据关键词构造的哈希森林,深度仅有1~2层,每一层代表所有需要检索的关键词组的字,层内采用哈希查找,查找出目标关键词后再根据有序规则数据结构判断关键词是否依次满足预置规则的关键词组合内容与要求的顺序,由于算法时间复杂度仅与哈希森林的平均深度有关,所以可以在规则多且复杂、关键词数量众多的情况下保证算法时间复杂度为常数,从而实现了快速地对短信中的垃圾短信进行识别。 | ||
| 搜索关键词: | 一种 垃圾 短信 识别 方法 系统 | ||
【主权项】:
一种垃圾短信识别方法,其特征在于,包括:步骤A:在短信中未被确定为关键词的各个字符中,按顺序选择一个作为目标检测字;步骤B:在预先设置的各个关键词组中,判断是否具有一个首字符与所述目标检测字一致的关键词组,如果否,则返回步骤A,直至检测完所述短信的各个字符;如果是,则执行步骤C;步骤C:通过对根据所述关键词构造的哈希森林判断所述短信中是否具有与目标关键词组一致的词组,如果是,则将所述词组作为待组合关键词组,并返回步骤A,直至检测完所述短信的各个字符;否则,返回步骤A,直至检测完所述短信的各个字符;其中,所述目标关键词组为步骤B中所确定的首字符与所述目标检测字一致的关键词组,所述哈希森林的每一层包含组成所述关键词的字,所述每一层内采用哈希查找;当检测得到待组合关键词组时,判断各个待组合关键词组的组合是否符合预置的规则,如果是,则确定所述短信为垃圾短信。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大汉三通通信股份有限公司;,未经上海大汉三通通信股份有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410854776.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种用户流量实时统计方法及系统
- 下一篇:消息提醒装置及其工作方法





