[发明专利]一种拦截网页中的广告的方法及装置有效
申请号: | 201410124030.3 | 申请日: | 2014-03-28 |
公开(公告)号: | CN103886088B | 公开(公告)日: | 2017-05-17 |
发明(设计)人: | 朱佳来;陈亮 | 申请(专利权)人: | 北京金山网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 张大威 |
地址: | 100041 北京市石景山区八*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 拦截 网页 中的 广告 方法 装置 | ||
技术领域
本发明涉及网页识别技术领域,尤其涉及一种拦截网页中的广告的方法及装置。
背景技术
随着互联网技术的不断进步,互联网用户的不断增加,电子商务产业取得了蓬勃发展,原来通过电视、楼宇等传播的广告越来越多地流向互联网。
网页中的广告,比如页面顶部的广告、两侧浮游窗口的广告、固定广告位的广告等,一般是网站运营商发布的,或者是关联客户发布的,所以网站运营商不会屏蔽这类广告。但是这类广告会给用户造成干扰,如果用户是使用手机等移动终端来浏览网页,这些广告会占用一定的流量资源。
因此,本发明的发明人发现,如何识别网页中的广告,为屏蔽广告提供便利,成为目前亟待解决的技术问题。
发明内容
为克服相关技术中存在的问题,本发明实施例提供一种拦截网页中的广告的方法及装置,用于实现自动筛选出疑似广告,快速识别出广告,并自动生成拦截规则,为屏蔽广告提供便利。
一方面,本发明实施例提供了一种拦截网页中的广告的方法,包括:
获取预置的网址对应的网页数据;
对所述网页数据进行分析,获得疑似广告;
判断所述疑似广告是否为实际广告;
当所述疑似广告为实际广告时,生成相应的广告拦截规则;
根据生成的相应的广告拦截规则拦截网页中的广告。
优选地,所述对所述网页数据进行分析,获得疑似广告,包括:获取所述网页数据的源文件中网页元素的属性标识;判断所述属性标识的值中是否包含广告的特征字符;将包含广告的特征字符的属性标识对应的网页元素确定为疑似广告。
优选地,所述对所述网页数据进行分析,获得疑似广告,包括:根据所述网页数据,判断网页页面中的预设位置是否存在预设尺寸区间内的窗口;当网页页面中的预设位置存在预设尺寸区间内的窗口时,将所述窗口对应的网页数据确定为疑似广告。
优选地,所述对所述网页数据进行分析,获得疑似广告,包括:根据所述网页数据,判断是否存在与屏幕大小一致且置于顶层的全屏显示的窗口,所述全屏显示的窗口内存在不超过第一预设个数的图片和第二预设个数的按钮;当判断为是时,将所述全屏显示的窗口对应的网页数据确定为疑似广告。
优选地,所述对所述网页数据进行分析,获得疑似广告,包括:判断所述网页数据中的窗口网页元素的统一资源定位符URL是否为包含广告的特征字符的URL;当所述网页数据中的窗口网页元素的URL为包含广告的特征字符的URL时,将所述窗口网页元素对应的网页数据确定为疑似广告。
优选地,所述判断所述疑似广告是否为实际广告,包括:如果所述疑似广告部分的填充颜色与网页的填充颜色的色差达到预设的阈值;确定所述疑似广告为实际广告;或者根据所述疑似广告的颜色直方图变化率,判断所述疑似广告是否为实际广告;当所述疑似广告的颜色直方图变化率大于或等于预设阈值时,确定所述疑似广告为实际广告。
另一方面,本发明实施例提供了一种拦截网页中的广告的装置,包括:
获取模块,用于获取预置的网址对应的网页数据;
分析模块,用于对所述网页数据进行分析,获得疑似广告;
判断模块,用于判断所述疑似广告是否为实际广告;
生成模块,用于当所述疑似广告为实际广告时,生成相应的广告拦截规则;
拦截模块,用于根据生成的相应的广告拦截规则拦截网页中的广告。
优选地,所述分析模块用于获取所述网页数据的源文件中网页元素的属性标识;判断所述属性标识的值中是否包含广告的特征字符;将包含广告的特征字符的属性标识对应的网页元素确定为疑似广告。
优选地,所述分析模块用于根据所述网页数据,判断网页页面中的预设位置是否存在预设尺寸区间内的窗口;当网页页面中的预设位置存在预设尺寸区间内的窗口时,将所述窗口对应的网页数据确定为疑似广告。
优选地,所述分析模块用于根据所述网页数据,判断是否存在与屏幕大小一致且置于顶层的全屏显示的窗口,所述全屏显示的窗口内存在不超过第一预设个数的图片和第二预设个数的按钮;当判断为是时,将所述全屏显示的窗口对应的网页数据确定为疑似广告。
优选地,所述分析模块用于判断所述网页数据中的窗口网页元素的统一资源定位符URL是否为包含广告的特征字符的URL;当所述网页数据中的窗口网页元素的URL为包含广告的特征字符的URL时,将所述窗口网页元素对应的网页数据确定为疑似广告。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山网络科技有限公司,未经北京金山网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410124030.3/2.html,转载请声明来源钻瓜专利网。