[发明专利]用于浏览器的网页数据展现方法及装置有效

专利信息
申请号: 201210553767.8 申请日: 2012-12-18
公开(公告)号: CN103020246B 公开(公告)日: 2018-01-05
发明(设计)人: 谢洲为;潘洪学;糜裕峰;任寰 申请(专利权)人: 北京奇虎科技有限公司;奇智软件(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京国昊天诚知识产权代理有限公司11315 代理人: 许志勇
地址: 100088 北京市西城区新*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 浏览器 网页 数据 展现 方法 装置
【说明书】:

技术领域

发明涉及计算机技术领域,尤其涉及一种用于浏览器的网页数据展现方法及装置。

背景技术

随着互联网技术的普及,网络已经成为人们获取信息的重要途径之一,其中网页中的文本内容是信息的主要载体。现在网页中内容多种多样,除了常规的文字内容外,网页中也部分或者全部地包括图片和其它非文字类别的多媒体内容,例如Flash插件、音频播放插件、广告类弹窗或者图片。对于小说网站这一类的网页内容全是文本的网站,其主要的内容多是文本,小说内容才是用户需要进行阅读的主要部分,但是其网页中的右侧或者左侧等网页部分会设置有大量的广告类图片信息,影响用户的阅读。而对于一些漫画网站,其网页中的图片是主要内容,其网页中的右侧或者左侧等网页部分会设置有大量的广告类图片信息,也会影响用户的阅读。

可见,在一般网页中,含有图片信息的内容排版的不规则,大量广告图片、页面非内容图片太多,以至于影响用户阅读体验,并且用户无法屏蔽其余多余内容,而聚集在真正阅读内容上,严重影响了用户的阅读体验。

发明内容

鉴于上述问题,提出了本发明,以便提供一种克服上述问题或者至少部分地解决上述问题的用于浏览器的网页数据展现方法及装置。

为解决上述技术问题,本发明提供一种用于浏览器的网页数据展现方法,包括:加载至少一个网页内容提取设置,所述设置中记录有网页的数据组织结构以及该结构下的数据提取方式;在浏览器侧进行网页内容的下载,通过分层解析获得该下载网页的数据组织结构,并与所述网页内容提取设置中记录的网页的数据组织结构相匹配;获取一与所述下载的网页具有相匹配的数据组织结构的网页内容提取设置;根据该匹配的网页内容提取设置中的数据提取方式,按照对应的数据组织结构提取所述下载的网页中的网页数据;依据用户的触发指令加载所述提取的网页数据在浏览器侧进行显示;如果没有匹配到与当前已经加载的网页的数据组织结构相匹配的网页内容提取设置,则以最为接近的网页内容提取设置提取所述下载的网页中的网页数据。

本发明的另一方面,提供一种用于浏览器的网页数据展现装置,包括:加载设置模块:用于加载至少一个网页内容提取设置,所述设置中记录有网页的数据组织结构以及该结构下的数据提取方式;匹配设置模块:用于在浏览器侧进行网页内容的下载,通过分层解析获得该下载网页的数据组织结构,并与所述网页内容提取设置中记录的网页的数据组织结构相匹配;获取设置模块:用于获取一与所述下载的网页具有相匹配的数据组织结构的网页内容提取设置;提取数据模块:用于根据该匹配的网页内容提取设置中的数据提取方式,按照对应的数据组织结构提取所述下载的网页中的网页数据;显示数据模块:用于依据用户的触发指令加载所述提取的网页数据在浏览器侧进行显示;其中,如果所述匹配设置模块没有匹配到与当前已经加载的网页的数据组织结构相匹配的网页内容提取设置,则所述提取数据模块用于以最为接近的网页内容提取设置提取所述下载的网页中的网页数据。

与现有技术相比,本发明可以针对不同格式、结构的网页,通过分层解析获得该网页的数据组织结构,从而能与网页内容提取设置中记录的网页的数据组织结构相匹配,从而确定并获取一与所述下载的网页具有相匹配的数据组织结构的网页内容提取设置,并且根据该匹配的网页内容提取设置中的数据提取方式,按照对应的数据组织结构提取所述下载的网页中的网页数据在浏览器侧进行显示。由于所述网页内容提取设置的数据组织结构能够与网页的数据组织结构相匹配,所以这种显示可以确保显示的网页内容不发生混乱,并且可以剔除不与之匹配的不重要的、杂乱的内容,例如大量广告图片、页面非内容图片太多,使浏览器用户可以将注意力聚集在真正想要阅读的内容上,提高用户阅读体验。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了根据本发明实施例所述的一种用于浏览器的网页数据展现方法的流程图;

图2示出了根据本发明实施例所述的一种在浏览器侧展现图片及其对应文字的方法的流程图;

图3示出了根据本发明实施例所述的一种在浏览器侧展现图片及其对应文字的方法中图片及文字在网页中的结构图;

图4示出了根据一个网页内容提取设置由网页300提取内容后最终显示的网页300S;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210553767.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top