[发明专利]一种信息过滤的方法及装置无效
申请号: | 200610109851.5 | 申请日: | 2006-08-18 |
公开(公告)号: | CN101075981A | 公开(公告)日: | 2007-11-21 |
发明(设计)人: | 王欣磊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;H04L29/06 |
代理公司: | 北京德琦知识产权代理有限公司 | 代理人: | 宋志强;麻海明 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息 过滤 方法 装置 | ||
技术领域
本发明涉及互联网技术,尤指一种信息过滤的方法及装置。
背景技术
在目前的聊天室广告过滤方法中,通常采用的是关键字过滤的方法,对发送到聊天室的聊天信息进行过滤。关键字过滤的方法通过收集在广告信息中经常出现的关键字语,针对发送到聊天室中的每一条聊天信息进行判断,判断聊天信息中是否存在收集的关键字,如果存在,则过滤掉该聊天信息,不发送至聊天室;如果不存在,则将该聊天信息发送至聊天室。
通常情况下,广告信息发送者通过观察、分析被过滤的广告信息,对广告信息的内容进行适当修改,则能够比较容易绕过聊天室中根据关键字过滤广告的方法。例如,通过将被过滤掉的“视频聊天”改为“视屏聊天”,就可以比较容易的绕过关键字过滤方法。广告信息发送者通过发送“视屏聊天”同样能够达到邀请聊天室中其他用户“视频聊天”的目的。
因此,通过关键字过滤的方法,并不能成功的阻止各种类型的广告信息发送到聊天室,如垃圾广告、色情广告等,并且存在很大的漏判率和误判率。
发明内容
有鉴于此,本发明的主要目的在于提供一种信息过滤的方法;
同时,对应于本发明提供的方法,本发明还提供一种信息过滤的装置。
为达到上述目的,本发明的技术方案是这样实现的:
一种信息过滤的方法,设置垃圾联系方式数据库,该方法包括以下步骤:
A、判断待发送信息中是否携带联系方式,如果携带,则执行步骤B;否则,执行步骤D;
B、提取所述待发送信息中携带的联系方式,判断垃圾联系方式数据库中是否存在相同的联系方式,如果存在,则执行步骤C;否则,执行步骤D;
C、拒绝发送所述待发送信息;结束当前处理流程;
D、发送所述待发送信息。
其中,所述设置垃圾联系方式数据库为:预先将各垃圾联系方式记录于垃圾联系方式数据库中。
优选的,设置出现阈值;在步骤B判断得到垃圾联系方式数据库中不存在与所述待发送信息相同的联系方式,进行下一步操作之前,该方法进一步包括:
BD1、将步骤B中提取的联系方式的出现次数上加1,并判断所述联系方式的出现次数是否大于等于出现阈值,如果是,则将步骤B中提取的联系方式记录至垃圾联系方式数据库中,执行步骤C;否则,执行步骤D。
优选的,在步骤D之前,该方法进一步包括:
BD2、对所述待发送信息进行信息过滤,判断是否为广告信息,如果是,则执行步骤C;否则,执行步骤D。
同时作为本发明的一个优选实施方式,在步骤A之前,进一步包括:
a、对所述待发送信息进行信息过滤,判断是否为广告信息,如果是,则执行步骤b;否则,执行所述步骤A;
b、提取所述待发送信息中的联系方法,将提取出的联系方式记录至垃圾联系方式数据库,执行步骤C。
优选的,设置出现阈值;在步骤B判断得到垃圾联系方式数据库中不存在与所述待发送信息相同的联系方式,进行下一步操作之前,该方法进一步包括:
BD2、将步骤B中提取的联系方式的出现次数上加1,并判断所述联系方式的出现次数是否大于等于出现阈值,如果是,则将步骤B中提取的联系方式记录至垃圾联系方式数据库中,执行步骤C;否则,执行步骤D。
其中,使用正则表达式执行所述判断的操作。
其中,使用特征抽取技术提取待发送信息中的联系方式。
另外,本发明还提供了一种信息过滤的装置,该装置包括:联系方式过滤单元和垃圾联系方式存储单元;其中,
联系方式过滤单元,用于判断待发送信息中是否携带联系方式,发送没有携带联系方式的待发送信息;提取待发送信息中的联系方式,并根据垃圾联系方式存储单元中存储的垃圾联系方式,判断所述待发送信息中是否存在相同的联系方式,发送不存在相同联系方式的待发送信息,拒绝发送存在相同联系方式的待发送信息;
垃圾联系方式存储单元,用于存储垃圾联系方式。
另外,该装置进一步包括:信息过滤单元;信息过滤单元与联系方式过滤单元相连;
所述信息过滤单元位于联系方式过滤单元的输入端,用于预先判断待发送信息是否为广告信息,发送不为广告信息的待发送信息至联系方式过滤单元;拒绝发送为广告信息的待发送信息,并指示联系方式过滤单元将该待发送信息中的联系方式记录为垃圾联系方式;相应的,
联系方式过滤单元,进一步用于根据信息过滤单元的指示,提取为广告信息的待发送信息中的联系方式,并记录至垃圾联系方式存储单元;
或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610109851.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置