[发明专利]垃圾短消息确定方法及装置无效
申请号: | 201010606069.0 | 申请日: | 2010-12-24 |
公开(公告)号: | CN102572745A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 卞宁艳;钱庆锋;吴勇;徐盈;吕进 | 申请(专利权)人: | 中国移动通信集团上海有限公司 |
主分类号: | H04W4/14 | 分类号: | H04W4/14;H04W12/00;H04W88/18 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 200060 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 垃圾 短消息 确定 方法 装置 | ||
技术领域
本发明涉及通信技术领域,尤其涉及一种垃圾短消息确定方法及装置。
背景技术
移动通信中的短消息业务已经成为移动用户之间常用的一种通信方式,由于短消息的快捷与方便,可以通过短消息进行信息交互或信息发布等,移动用户之间相互发送的普通短消息主要用于信息的交流,基本上是两个移动用户或者多个移动用户之间互相发送。
随着短消息成为人们生活当中不可或缺的通信方式,垃圾短消息的问题也逐渐引起社会广泛关注。垃圾短消息主要是利用短消息传播非法或不良信息,其中有很多欺诈、广告、假中奖等垃圾短消息的内容中包含电话号码或银行账号等数字类信息,这些垃圾短消息利用其所包含的数字类信息欺骗广大移动用户,损害人们的经济利益,因此,准确地确定及拦截这些包含数字类信息的垃圾短消息是通信安全技术领域非常重要的环节。
现有技术中,一般通过如下方式确定并拦截垃圾短消息,具体为:首先采用两次散列对短消息内容进行快速过滤,得到“嫌疑短消息”,再对“嫌疑短消息”进行文本预处理,剔除数字、符号、语气词等其认为与语义无关的内容后,将其转化为短语向量,采用贝叶斯和支持向量机两种分类器相结合的方法对“嫌疑短消息”进行判定。
上述方法采用了剔除数字、符号、语气词等其认为与语义无关的内容的语义分析方法,但是针对包含数字类信息的垃圾短消息来说,数字类信息是垃圾短消息内容中相对固定的信息,因此过滤掉数字类信息,就相当于删除了这些垃圾短消息内容的共同特征,使得确定并拦截包含数字类信息的垃圾短消息的准确性较低。
发明内容
本发明实施例提供一种垃圾短消息确定方法及装置,用以解决现有技术存在的确定包含数字类信息的垃圾短消息的准确性较低的问题。
本发明实施例技术方案如下:
一种垃圾短消息确定方法,该方法包括步骤:从短消息中心中获得待发送的短消息;从该短消息的内容中,识别出所包含的各广义数字,其中广义数字为具有数字含义的字符;根据识别出的各广义数字,确定该短消息对应的数字特征向量;将确定出的数字特征向量和预设的垃圾短消息数字特征向量库中的各垃圾短消息数字特征向量进行匹配;若匹配成功,则确定该短消息为垃圾短消息。
一种垃圾短消息确定装置,包括:第一获得单元,用于从短消息中心中获得待发送的短消息;识别单元,用于从第一获得单元获得的该短消息的内容中,识别出所包含的各广义数字,其中广义数字为具有数字含义的字符;第一确定单元,用于根据识别单元识别出的各广义数字,确定该短消息对应的数字特征向量;匹配单元,用于将第一确定单元确定出的数字特征向量和预设的垃圾短消息数字特征向量库中的各垃圾短消息数字特征向量进行匹配;第二确定单元,用于在匹配单元匹配成功时,确定该短消息为垃圾短消息。
本发明实施例技术方案中,首先从短消息中心中获得待发送的短消息,然后从该短消息的内容中,识别出所包含的各广义数字,其中广义数字为具有数字含义的字符,根据识别出的各广义数字,确定该短消息对应的数字特征向量,将确定出的数字特征向量和预设的垃圾短消息数字特征向量库中的各垃圾短消息数字特征向量进行匹配,若匹配成功,则确定该短消息为垃圾短消息,由上可见,本发明实施例在确定垃圾短消息时,将具有数字含义的广义数字从短消息内容中提取出来进行匹配,也就是说根据短消息内容中包含的数字类信息来确定垃圾短消息,这就有效地提高了确定数字类信息的垃圾短消息的准确性。
附图说明
图1为本发明实施例中,垃圾短消息确定方法网络架构示意图;
图2为本发明实施例中,垃圾短消息确定方法流程示意图;
图3为本发明实施例一中,垃圾短消息确定方法具体实现流程示意图;
图4为本发明实施例二中,垃圾短消息确定方法具体实现流程示意图;
图5为本发明实施例中,垃圾短消息确定装置结构示意图。
具体实施方式
下面结合各个附图对本发明实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。
如图1所示,为本发明实施例中的垃圾短消息确定方法网络架构图,其中,当用户11作为短消息发送方需要向短消息接收方发送短消息时,用户11需要将该待发送的短消息提交至短消息中心12,该短消息中包含短消息内容、短消息发送方标识以及短消息接收方标识,短消息中心12将接收到的待发送的短消息发送给本发明实施例提出的垃圾短消息确定装置13,垃圾短消息确定装置13确定该待发送的短消息是否为垃圾短消息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团上海有限公司,未经中国移动通信集团上海有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010606069.0/2.html,转载请声明来源钻瓜专利网。