[发明专利]用于浏览器的网页数据展现方法及装置有效
| 申请号: | 201210553767.8 | 申请日: | 2012-12-18 |
| 公开(公告)号: | CN103020246B | 公开(公告)日: | 2018-01-05 |
| 发明(设计)人: | 谢洲为;潘洪学;糜裕峰;任寰 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 许志勇 |
| 地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 浏览器 网页 数据 展现 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于浏览器的网页数据展现方法及装置。
背景技术
随着互联网技术的普及,网络已经成为人们获取信息的重要途径之一,其中网页中的文本内容是信息的主要载体。现在网页中内容多种多样,除了常规的文字内容外,网页中也部分或者全部地包括图片和其它非文字类别的多媒体内容,例如Flash插件、音频播放插件、广告类弹窗或者图片。对于小说网站这一类的网页内容全是文本的网站,其主要的内容多是文本,小说内容才是用户需要进行阅读的主要部分,但是其网页中的右侧或者左侧等网页部分会设置有大量的广告类图片信息,影响用户的阅读。而对于一些漫画网站,其网页中的图片是主要内容,其网页中的右侧或者左侧等网页部分会设置有大量的广告类图片信息,也会影响用户的阅读。
可见,在一般网页中,含有图片信息的内容排版的不规则,大量广告图片、页面非内容图片太多,以至于影响用户阅读体验,并且用户无法屏蔽其余多余内容,而聚集在真正阅读内容上,严重影响了用户的阅读体验。
发明内容
鉴于上述问题,提出了本发明,以便提供一种克服上述问题或者至少部分地解决上述问题的用于浏览器的网页数据展现方法及装置。
为解决上述技术问题,本发明提供一种用于浏览器的网页数据展现方法,包括:加载至少一个网页内容提取设置,所述设置中记录有网页的数据组织结构以及该结构下的数据提取方式;在浏览器侧进行网页内容的下载,通过分层解析获得该下载网页的数据组织结构,并与所述网页内容提取设置中记录的网页的数据组织结构相匹配;获取一与所述下载的网页具有相匹配的数据组织结构的网页内容提取设置;根据该匹配的网页内容提取设置中的数据提取方式,按照对应的数据组织结构提取所述下载的网页中的网页数据;依据用户的触发指令加载所述提取的网页数据在浏览器侧进行显示;如果没有匹配到与当前已经加载的网页的数据组织结构相匹配的网页内容提取设置,则以最为接近的网页内容提取设置提取所述下载的网页中的网页数据。
本发明的另一方面,提供一种用于浏览器的网页数据展现装置,包括:加载设置模块:用于加载至少一个网页内容提取设置,所述设置中记录有网页的数据组织结构以及该结构下的数据提取方式;匹配设置模块:用于在浏览器侧进行网页内容的下载,通过分层解析获得该下载网页的数据组织结构,并与所述网页内容提取设置中记录的网页的数据组织结构相匹配;获取设置模块:用于获取一与所述下载的网页具有相匹配的数据组织结构的网页内容提取设置;提取数据模块:用于根据该匹配的网页内容提取设置中的数据提取方式,按照对应的数据组织结构提取所述下载的网页中的网页数据;显示数据模块:用于依据用户的触发指令加载所述提取的网页数据在浏览器侧进行显示;其中,如果所述匹配设置模块没有匹配到与当前已经加载的网页的数据组织结构相匹配的网页内容提取设置,则所述提取数据模块用于以最为接近的网页内容提取设置提取所述下载的网页中的网页数据。
与现有技术相比,本发明可以针对不同格式、结构的网页,通过分层解析获得该网页的数据组织结构,从而能与网页内容提取设置中记录的网页的数据组织结构相匹配,从而确定并获取一与所述下载的网页具有相匹配的数据组织结构的网页内容提取设置,并且根据该匹配的网页内容提取设置中的数据提取方式,按照对应的数据组织结构提取所述下载的网页中的网页数据在浏览器侧进行显示。由于所述网页内容提取设置的数据组织结构能够与网页的数据组织结构相匹配,所以这种显示可以确保显示的网页内容不发生混乱,并且可以剔除不与之匹配的不重要的、杂乱的内容,例如大量广告图片、页面非内容图片太多,使浏览器用户可以将注意力聚集在真正想要阅读的内容上,提高用户阅读体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明实施例所述的一种用于浏览器的网页数据展现方法的流程图;
图2示出了根据本发明实施例所述的一种在浏览器侧展现图片及其对应文字的方法的流程图;
图3示出了根据本发明实施例所述的一种在浏览器侧展现图片及其对应文字的方法中图片及文字在网页中的结构图;
图4示出了根据一个网页内容提取设置由网页300提取内容后最终显示的网页300S;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210553767.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





