[发明专利]竖向文本广告过滤方法和装置有效
申请号: | 201510863048.X | 申请日: | 2015-11-30 |
公开(公告)号: | CN106815249B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 陈尔晓 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F40/20 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 蒋雅洁;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 竖向 文本 广告 过滤 方法 装置 | ||
本发明公开了一种竖向文本广告过滤方法,所述竖向文本广告过滤方法包括步骤:获取文本信息;将所述文本信息按照行进行分组,依次生成若干第一文本序列;按照顺序依次提取各个所述第一文本序列对应位置的字符,根据所述对应位置依次生成若干第二文本序列;根据所述第二文本序列过滤广告。由于本发明通过依次提取第一文本序列对应位置的字符而生成第二文本序列,根据第二文本序列过滤广告,因此能够有效地识别竖向文本信息,从而达到过滤掉竖向广告的目的。
技术领域
本发明涉及到互联网技术领域,特别涉及到一种竖向文本广告过滤方法和装置。
背景技术
互联网的快速发展给人们的生活带来了极大的便利,人们可以利用互联网浏览网页(如QQ浏览器的话题圈评论系统或一些论坛网站等)、或者通过聊天工具进行通信(如QQ、微信等)、或者通过安装一些应用软件获取一些信息(如天气预报应用、日历应用等)。
在互联网给人们带来便利的同时,一些广告发布者会利用互联网的便利发布各种广告,给用户带来了极大的烦恼。例如,广告发布者通常在QQ浏览器的话题圈评论系统上发布广告,或者在QQ群聊、微信群聊里发布广告,或者在一些应用软件中自动弹出一浮窗来发布广告。
为了自动过滤掉这些广告,现有技术中通常会对当前页面上显示的文本信息按照行进行语义识别,在识别结果为广告时则进行过滤处理。
然而,广告发布者为了利用现有广告过滤方法的漏洞,通常会发布一些竖向广告。如图1所示,图1为竖向广告的示意图,这种广告通常需要竖向阅读。例如,对于图1所示的竖向广告,其实际广告内容为“买时尚睡衣加微信357mai”。由于现有的广告过滤方法一般都是按照行进行广告识别,若采用现有技术进行识别,则按照行将上述竖向广告解析为“买加7时微m尚信a睡3i衣5”,此时解析出的内容的语义已经发生变化,采用现有的方法并不能识别出其为广告,因此现有技术对竖向广告的识别率比较低下,并不能过滤掉竖向广告。
发明内容
本发明实施例提供一种竖向文本广告过滤方法和装置,旨在解决不能过滤掉竖向广告的技术问题。
为实现上述目的,本发明实施例提出竖向文本广告过滤方法,所述竖向文本广告过滤方法包括步骤:
获取文本信息;
将所述文本信息按照行进行分组,依次生成若干第一文本序列;
按照顺序依次提取各个所述第一文本序列对应位置的字符,根据所述对应位置依次生成若干第二文本序列;
根据所述第二文本序列过滤广告。
为了实现上述目的,本发明实施例还进一步提出一种竖向文本广告过滤装置,所述竖向文本广告过滤装置包括:
获取模块,用于获取文本信息;
分组模块,用于将所述文本信息按照行进行分组,依次生成若干第一文本序列;
提取模块,按照顺序依次提取各个所述第一文本序列对应位置的字符,根据所述对应位置依次生成若干第二文本序列;
过滤模块,用于根据所述第二文本序列过滤广告。
本发明提出的竖向文本广告过滤方法和装置,通过获取文本信息,先将所述文本信息按照行进行分组,依次生成若干第一文本序列,然后再按照顺序依次提取各个所述第一文本序列对应位置的字符,根据所述对应位置依次生成若干第二文本序列,最后根据所述第二文本序列过滤广告。由于本发明通过依次提取第一文本序列对应位置的字符而生成第二文本序列,根据第二文本序列过滤广告,因此能够有效地识别竖向文本信息,从而达到过滤掉竖向广告的目的。
附图说明
图1为竖向文本广告的示意图;
图2为本发明实施例竖向文本广告过滤装置所涉及的硬件架构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510863048.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网站分析方法及装置
- 下一篇:一种发送数据的方法、数据服务器以及服务器