[发明专利]一种短信智能删除模块在审
申请号: | 201310433559.9 | 申请日: | 2013-09-21 |
公开(公告)号: | CN103888921A | 公开(公告)日: | 2014-06-25 |
发明(设计)人: | 牛晓芳 | 申请(专利权)人: | 天津思博科科技发展有限公司 |
主分类号: | H04W4/14 | 分类号: | H04W4/14;H04W88/02;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300100 天津市南*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 短信 智能 删除 模块 | ||
技术领域
本发明涉及短信智能删除领域,更具体的讲是一种通过对短信的内容进行关键信息的提取后,来断定短信是否为垃圾短信,根据判断结果对短信进行处理的模块。
背景技术
短信 short message service,简称SMS 是用户通过手机或其他电信终端直接发送或接收的文字或数字信息,用户每次能接收和发送短信的字符数,是160个英文或数字字符,或者70个中文字符。1992年,当世界上第一条短信在英国沃尔丰的GSM网络上通过PC向移动电话发送成功的时候,谁也不会想到,当初这项由电信运营商为解决手机话费过高而推出的低廉文本信息的服务,这个看似非常小孩玩意的一个通讯交流的东西,竟会在多年后对人们的经济文化生活,甚至对政治都产生了如此大的影响。
1992年,世界上第一条短信在英国沃达丰的网络上通过电脑向手机发送成功,从而宣布手机短信诞生。至于中国的第一条短信诞生于何时何地已无从知晓,但据考证,中国的移动通信网络早在1994年就具备了短信功能,只是那时有手机的人根本不需要它罢了。随着手机的日益普及,从1998年开始,移动、联通先后大范围拓展短信业务:2000年,中国手机短信息量突破10亿条;2001年,达到189亿条;2004年,数字飞涨到900亿条。于是短信理所应当地成为了第五种传播工具,“信生活”的提法也因此诞生;于是从1998年至今,七年的时间里,不管你愿意与否,短信已逐渐走入我们的生活,成为生活的一部分,我们的生活也因短信而改变着。
据工信部最新公布统计数据显示,2012年,全国移动短信发送量达到8973.1亿条,同比增长仅2.1%,增幅为四年最低。两项数据对比可以发现,我国手机用户增速远大于短信业务,我国2012年短信均发送量实际下滑了9%左右。
工信部数据显示,2012年我国移动电话用户达到11亿户,其中短信业务用户达到7.6亿户,渗透率为68.8%,手机网民用户约为4.2亿,渗透率为38.2%。另一方面,在我国11亿手机用户中,腾讯微信用户超过3亿户,渗透率为27.3%。而在中国每10个手机网民中,就有超过7个为微信用户。
电信行业研究咨询机构欧文咨询公司之前也曾发布公告称,随着大量智能手机用户转而使用免费短信应用软件,至2012年底,全球电信运营商将因此损失230亿美元短信收入。
随着信息的不断发展,各种各类的短信如腊月的大雪一样漫天纷舞,手机已经脱离了那个纯净、安静的世界;无论是手机传统的短信还是各种社交应用如:微信,陌陌等,各种垃圾短信不期而至。
何为垃圾短息,垃圾短信,就是凡用户没有定制过的包含有广告、欺骗、色情、诅咒等违法内容以及短时间内连续发送同样内容,影响用户的正常使用、工作和生活的任何信息均为垃圾短信。
那么短信的智能拦截、删除就成为了各个通讯界、专家研究的热点。
发明内容
本发明公开了一种短信智能删除模块,目的在于通过对短信的内容进行关键信息的提取后,来断定短信是否为垃圾短信,根据判断结果对短信进行处理。
本发明是采取以下技术方案实现的:一种短信智能删除模块,包括短信特征词提取、关键字标注、短信内容判断和短信处理四个步骤。短信处理分为短信保留和短信删除两种方式。
本发明的实现还包括以下的技术方案:
上述短信特征词提取将涉及到中文文本信息提取与中文分词算法,本发明将采取正向最大匹配算法对关键字进行提取。
实现上述短信特征词的提取需要建立词典,好的词典是中文分词准确率的保障。
正向最大匹配算法:从左到右将待分词文本中的几个连续字符与词表匹配,如果匹配上,则切分出一个词。但这里有一个问题:要做到最大匹配,并不是第一次匹配到就可以切分的 。我们来举个例子:
待分词文本:content[]={中,华,民,族,从,此,站,起,来,了,。}
词表:dict[]={中华, 中华民族 , 从此,站起来}
(1) 从content[1]开始,当扫描到content[2]的时候,发现中华已经在词表dict[]中了。但还不能切分出来,因为我们不知道后面的词语能不能组成更长的词(最大匹配)。
(2) 继续扫描content[3],发现中华民并不是dict[]中的词。但是我们还不能确定是否前面找到的中华已经是最大的词了。因为中华民是dict[2]的前缀。
(3) 扫描content[4],发现中华民族是dict[]中的词。继续扫描下去。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津思博科科技发展有限公司,未经天津思博科科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310433559.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:输气管道位移补偿器
- 下一篇:马铃薯二季作种薯的繁育方法