[发明专利]检测页面叠加区域的方法和装置在审
申请号: | 202110137484.4 | 申请日: | 2021-02-01 |
公开(公告)号: | CN113762235A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 陈震 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/38;G06K9/46;G06T7/11 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 韩黎捷;郭晗 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 页面 叠加 区域 方法 装置 | ||
本发明公开了一种检测页面叠加区域的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:隐藏页面中除目标区块以外的其他区块,并确定目标区块的内容区域边界;根据目标区块的内容区域边界,得到目标区块的内容区域的第一像素矩阵;恢复展示其他区块,并提取目标区块的内容区域的第二像素矩阵;根据第一像素矩阵和第二像素矩阵检测页面中的叠加区域。该实施方式在实现自动化检测的基础上提高了精确度和智能性,使用操作简便,节省了时间和人力成本,并且此方法具有普适性,动态地解决了页面空白边距重叠而带来的重叠误判问题,能够比较精准有效的判断页面中的实际内容是否存在叠加,由此能够提高网页页面整体质量,提升用户体验。
技术领域
本发明涉及计算机技术领域,尤其涉及一种检测页面叠加区域的方法和装置。
背景技术
用户浏览网页是通过浏览网页中的文字和图片等内容来获取所需的信息,因此互联网网页合理的页面布局能够方便用户阅读和获取页面上的信息,进而才有可能转化为商业行为,而不合理的页面布局有可能会导致页面文字被部分覆盖或全部覆盖,从而影响用户的正常阅读,使得用户不能从浏览页面中获取有效的信息。通常检测文字或图片等网页内容的叠加是通过人工检查来完成,另外一种相对简单的检测办法是把网页内容叠加检测转换为文字或图片等内容所在的区块(block)叠加检测,这种方法把区块(block)视为一个带尺寸的矩形,当两个矩形的长宽之和的一半大于两个矩形中心点距离时,视为矩形存在区域叠加。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
人工检查费时费力,而且叠加判断结果带有主观性,不够精确和智能,在多场景检测和兼容性检测时操作麻烦;区块矩形尺寸叠加判断方法可以实现自动化检测,但是区块一般存在内边距和外边距,不能直接使用矩形的外边界边框尺寸进行判断,即使考虑了矩形的内外边距改用内容区域尺寸来比较,由于文字并非占据内容区域的全部区域,使用内容区域尺寸来判断叠加也不够精确。
发明内容
有鉴于此,本发明实施例提供一种检测页面叠加区域的方法和装置,能够基于画布(Canvas)技术提取网页区块的内容区域边界,并在像素值统计基础上检测页面叠加,在判断页面叠加时不受区块(block)内外边距的影响,内容区域边界完全由内容区域中的实际内容显示决定,具有普适性,动态地解决了内容区域空白边距重叠而带来的重叠误判问题,能够比较精准有效的判断区块(block)中的实际内容是否存在叠加,由此能够提高网页页面整体质量,提升用户体验。
为实现上述目的,根据本发明实施例的一个方面,提供了一种检测页面叠加区域的方法。
一种检测页面叠加区域的方法,包括:隐藏页面中除目标区块以外的其他区块,并确定目标区块的内容区域边界;根据目标区块的内容区域边界,得到目标区块的内容区域的第一像素矩阵;恢复展示其他区块,并提取目标区块的内容区域的第二像素矩阵;根据第一像素矩阵和第二像素矩阵检测页面中的叠加区域。
可选地,在确定目标区块的内容区域边界之前,还包括:对页面进行锐化处理。
可选地,锐化处理包括:将页面的背景色设置为白色;将目标区块的背景色设置为完全透明色;将目标区块的内容颜色设置为黑色。
可选地,确定目标区块的内容区域边界包括:获取目标区块的内容区域的位置和大小;提取目标区块的内容区域内每个像素点的像素值;将像素值转换为二进制数值以得到目标区块的内容区域对应的二进制像素矩阵;根据二进制像素矩阵得到目标区块的内容区域边界。
可选地,根据二进制像素矩阵得到目标区块的内容区域边界之前,还包括:将二进制像素矩阵中孤立的0值设置为1以进行去噪处理,其中,0为黑色点对应的二进制数值,1为白色点对应的二进制数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110137484.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据统计方法和装置
- 下一篇:一种视频图像的美化方法和装置