[发明专利]一种信息过滤方法及装置有效
申请号: | 201310403218.7 | 申请日: | 2013-09-06 |
公开(公告)号: | CN104427503B | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 祝希路 | 申请(专利权)人: | 中国移动通信集团湖南有限公司 |
主分类号: | H04W12/12 | 分类号: | H04W12/12;H04L29/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;王黎延 |
地址: | 410005 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 过滤 方法 装置 | ||
本发明公开了一种信息过滤方法,所述方法包括:根据每一账号的通信记录确定该账号对应的核心交往群和非核心交往群;根据该核心交往群中的各成员的通信记录,以及该非核心交往群中的各成员的通信记录确定该账号的声誉值;根据该账号的声誉值确定该账号是否为垃圾账号。本发明同时还公开了一种信息过滤装置。采用本发明的技术方案,通过对所述垃圾账号发送的信息进行拦截,从而保证了垃圾信息的查全率和查准率。
技术领域
本发明涉及信息过滤技术,尤其涉及一种信息过滤方法及装置。
背景技术
垃圾短信、广告等信息的泛滥是困扰用户和移动通信运营商的一个重大问题,因此很有必要对信息进行识别和过滤。目前运营商广泛使用的信息过滤手段主要可分为用户级别的过滤和单条信息级别的过滤,处理对象分别对应为单个的信息发送用户和单条的信息。
用户级别的过滤方法主要包括:基于频率阈值的过滤方法和黑白名单方法,其中,基于频率阈值的过滤方法是在信息拦截过程中设定频率阈值,频率阈值的设定主要依赖经验,因此,主观因素会造成大量合法短信的误判和信息的漏判,从而导致效果不是很明显。黑白名单方法克服了基于频率阈值的过滤方法的缺陷,但是黑白名单方法中黑白名单需要手工维护,费时费力,而且在使用的过程中,黑白名单的数量会越来越庞大,从而影响短信发送的及时性。
单条信息级别的过滤方法主要包括关键字过滤方法,关键字过滤方法首先需要不断地更新词库,但由于关键字选取难度很大,不能保证过滤掉所有垃圾关键字;而且,通过关键字匹配很难判断出短信的内容合法性,很容易造成误判,而且通过使用拼音、套用错别字、同音字和在信息中间加许多符号等方法可以很容易的绕过关键字列表。因此,亟需提供一种垃圾信息的查全率和查准率高的信息过滤方法及装置。
发明内容
有鉴于此,本发明的主要目的在于提供一种信息过滤方法及装置,通过对垃圾账号发送的信息进行拦截,从而保证了垃圾信息的查全率和查准率。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供的一种信息过滤方法,所述方法包括:根据每一账号的通信记录确定该账号对应的核心交往群和非核心交往群;根据该核心交往群中的各成员的通信记录,以及该非核心交往群中的各成员的通信记录确定该账号的声誉值;根据该账号的声誉值确定该账号是否为垃圾账号。
上述方案中,所述根据每一账号的通信记录确定该账号对应的核心交往群和非核心交往群,包括:对于每一账号A:确定与账号A进行通信的对端账号Ap,其中,0≤p≤N,N为与所述账号A进行通信的账号的总数;确定所述账号A的对端账号之间是否存在通信关系;将对端账号之间具有通信关系的对端账号确定为所述账号A的核心交往群;反之,将对端账号确定为所述账号A的非核心交往群。
上述方案中,所述确定所述账号A的对端账号之间是否存在通信关系,包括:判断任意两对端账号之间进行通信的次数与预设通信阈值之间的关系;当判断结果为任意两对端账号之间进行通信的次数大于等于所述通信阈值时,确定该两对端账号之间相互存在通信关系;反之,确定该两对端账号之间不存在通信关系。
上述方案中,在根据每一账号的通信记录确定该账号对应的核心交往群之前,所述方法还包括:通过数据提取转换和加载ETL、和/或、黑白名单方法确定每一账号的通信记录。
上述方案中,根据该核心交往群中的各成员的通信记录,以及该非核心交往群中的各成员的通信记录确定该账号的声誉值R(n+1)(A),包括:其中,R(n+1)(A)表示第n+1次迭代中账号A的声誉值;Ap为与账号A进行通信的对端账号,0≤p≤N,N为与所述账号A进行通信的对端账号的总数;ω表示阻尼因数;迭代初始值R(0)(A)=1;τ(A,Ap)为对端账号Ap对账号A的信任度评价;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团湖南有限公司,未经中国移动通信集团湖南有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310403218.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小区场景划分的方法及装置
- 下一篇:一种检测用户设备接近的方法和设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置