[发明专利]一种广告贴处理方法和系统有效
申请号: | 201310083905.5 | 申请日: | 2013-03-15 |
公开(公告)号: | CN104050195B | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 毕先春;崔天龙;高起;朱晨光 | 申请(专利权)人: | 暴风集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙)11017 | 代理人: | 韩登营 |
地址: | 100088 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 广告 处理 方法 系统 | ||
技术领域
本发明涉及互联网技术领域,特别涉及一种广告贴处理方法,本发明还特别涉及一种广告贴处理系统。
背景技术
网站一般都会提供与用户进行交互的功能,评论贴(亦即短评)就属于其中的一种,例如暴风影音播放器的暴风盒子页面展现了提供给用户观看的影片,在影片页面中同时还提供了短评功能,用户可以对该影片的内容、下载速度以及演员等等与影片相关的内容进行发帖评论,这些评论贴同时也会影响其他人的观看行为,比如大部分的人都评价说该片的情节很感人,画面很精美,那么就会吸引更多的人前来观看。
评论贴会对网站的访问量和知名度产生重要影响。因此个别商家和个人为了自己的商业目的会利用评论贴发布一些和影片完全无关的内容,比如销售商品的广告贴。为了提供给用户最优质的服务,需要对评论贴中发布的广告贴进行识别和过滤。
广告贴一般由程序自动发出,发贴的频率比较高(一般系统都会限制最短的发贴间隔,比如30s,程序会自动30s就发一个广告出来),广告贴的内容都是一样的,或者是相似的,以方便达到广告的效果。如一条广告贴内容是这样的:
大家好,我是一名大学生,我是开淘宝店的,想开网店的加我,保证一个月2500元以上,qq:5545299160;
下一条可能是内容完全一样的,或者是只是变动部分字符,如:
大家好我是一名大学生,我是开淘宝店的,想开网店的加我,保证一个月3500元以上,qq:5545299160。
在现有技术中,广告贴的过滤存在有如下两种方法:
第一,基于ip、用户帐户、邮件地址等能唯一确定用户身份的特征值进行过滤,对已经发布过广告贴的ip、帐户、邮件地址进行记录存入黑名单,对黑名单中的用户将直接禁止发帖。
第二,基于关键字匹配的过滤。关键字匹配是将广告贴中可能含有的一些关键字放到文件夹中,当来了一份新贴时,匹配此新帖中是否含有那些关键字,如果有就认为是广告贴。
然而,上述两种方法存在有如下缺陷:
第一种方法,此方法过滤简单,速度快,但是过滤效果差,对第一次出现的广告贴不起作用,并且用户的正常发帖也会被限制。
第二种方法,这种方法误判率很高,因为在广告贴中出现的关键字在正常贴中也可能出现,这种方法越来越少使用了。
有鉴于此,提供一种处理效率快、识别准确率高的广告贴处理方法,是本领域技术人员急需解决的问题。
发明内容
本发明要解决的技术问题是提供一种广告贴处理方法,针对用户发出的内容相同或相似的广告贴,该种处理方法能够快速准确地地识别出广告贴,并且运算复杂度降低,能够显著降低处理成本。此外,本发明还提供一种广告贴处理系统。
为解决上述技术问题,本发明提供一种广告贴处理方法,用于在用户所发的评论贴中识别出广告贴并处理,包括如下步骤:
S1:建立广告贴数据库并存储;
S2:将用户所发的评论贴依次与广告贴数据库中的各个广告贴进行比较计算,得出若干个第一相似度值;
S3:判断上述各个第一相似度值中是否存在至少一个第一相似度值小于预定的第一阈值,如果是,则转向下述步骤S4;如果否,则转向下述步骤S5;
S4:则该用户所发的评论贴为广告贴,不予发布,进入广告贴处理流程;
S5:则该用户所发的评论贴为正常贴,予以发布,进入正常贴处理流程。
优选地,当各个第一相似度值均不小于预定的第一阈值时,则步骤S3与步骤S5之间存在有如下步骤:
Sa:将该用户所发的评论贴与其先前所发的评论贴进行比较,得到至少一个第二相似度值;
Sb:判断上述各个第二相似度值中是否存在至少一个第二相似度值小于预定的第二阈值;如果是,则转向上述步骤S4;如果否,则转向上述步骤S5。
优选地,步骤S4进一步包括如下步骤:
S41:将该广告贴与广告贴数据库中的各个广告贴进行比较,得出若干个第三相似度值;
S42:判断上述各个第三相似度值中是否存在至少一个第三相似度值小于预定的第三阈值,如果是,则转向下述步骤S43;如果否,则转向下述步骤S44;
S43:将该广告贴删除;或提示管理员广告贴数据库已经存在有相似的广告贴,管理员选择删除或将该广告贴加入广告贴数据库;
S44:将该广告贴加入广告贴数据库。
优选地,在步骤S2中,通过以下算法获得第一相似度值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暴风集团股份有限公司,未经暴风集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310083905.5/2.html,转载请声明来源钻瓜专利网。