[发明专利]一种检测网页特征区域的方法和装置有效
申请号: | 201410244260.3 | 申请日: | 2014-06-04 |
公开(公告)号: | CN105446968B | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 梁捷;周超 | 申请(专利权)人: | 广州市动景计算机科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吴开磊 |
地址: | 510627 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 网页 特征 区域 方法 装置 | ||
本发明公开一种检测网页特征区域的方法和装置。该方法首先生成页面在过滤正常生效条件下的第一页面结果,在设定阈值时间后,生成页面的第二页面结果;然后将第二页面结果与所述第一页面结果比较,若发现存在不同的区域,确定所述存在不同的区域为产生问题的特征区域。在网页进行广告过滤的场景下,这些产生问题的特征区域就是广告区域,其原因可能是广告过滤规则失效导致本该过滤的广告出现,或者是广告过滤规则未包括的新广告。因此,本发明通过将网页与过滤正常生效下的参考网页进行比较,能快速的检测出网页中的特征区域(广告区域),快速发现问题,为后续的网页过滤处理提供参考依据,使得可以调整过滤规则,进而得到更好的过滤效果。
技术领域
本发明涉及移动通信技术领域,更为具体地,涉及检测网页特征区域的方法和装置。
背景技术
当今的网页中包含形形色色的广告,这些广告一方面影响了用户的体验,一方面还可能会引起访问时额外流量的消耗,一款能够智能过滤网页中广告的浏览器或者浏览器插件能带来用户体验上的很大提升。
现有的浏览器一般都设置了广告过滤规则,而广告过滤的规则制定方式都是通过用户反馈和人工排查两种方式来检查互联网上网页是否产生新的形式的广告,用户反馈的方式不够及时,而人工排查的方式又不够高效。
现有网页自动化检测广告的系统也有通过比较网页解析和排版过程中生成的DOM树和Render树的差异的方式来检测广告。该方法具体是通过广告过滤之后,获得没有广告的DOM树和Render树的网页,然后后续将待测网页与没有广告的网页比较DOM树和Render树,从而检测出广告。
但是,这种方式通常针对内容不会变化的测试页面,对于网页内容变化的互联网页面,无法区分是因为广告导致的变化还是因为网页本身内容导致的变化,从而可能无法检测出广告。并且,现有技术中广告过滤就是通过网页的DOM结构来过滤广告,如果自动化检测广告的系统也采用同样的机制,也很难达到检测广告的目的。
发明内容
鉴于上述问题,本发明的目的是提供一种检测网页特征区域的方法及装置,能快速的检测出网页中的特征区域,便于在网页广告过滤时快速发现问题,为后续的网页广告过滤处理提供参考依据,可以调整过滤规则,进而得到更好的过滤效果。
根据本发明的一个方面,提供一种检测网页特征区域的方法,包括:
生成页面在过滤正常生效条件下的第一页面结果;
在设定阈值时间后,生成页面在过滤正常生效条件下的第二页面结果;
将所述第二页面结果与所述第一页面结果比较,若发现存在不同的区域,确定所述存在不同的区域为产生问题的特征区域。
其中,生成页面在过滤正常生效条件下的第一页面结果包括:
在过滤正常生效条件下加载页面生成第一基础页面;
隐藏第一基础页面中没有被过滤的页面元素,将只包含被过滤的网页元素的第一基础页面确定为第一页面结果;
生成页面在过滤正常生效条件下的第二页面结果包括:
在过滤正常生效条件下加载页面生成第二基础页面;
隐藏第二基础页面中没有被过滤的页面元素,将只包含被过滤的网页元素的第二基础页面确定为第二页面结果。
其中,还包括:分别对第一页面结果和第二页面结果截图;
将第二页面的截图与第一页面的截图比较,若发现存在不同的区域,确定所述存在不同的区域为产生问题的特征区域。
其中,将所述第二页面结果与所述第一页面结果比较包括,
判断页面是否存在偏移;
如果存在页面偏移则计算页面偏移值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市动景计算机科技有限公司,未经广州市动景计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410244260.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:推荐项目的方法和装置
- 下一篇:原文和译文的对齐方法和装置