[发明专利]一种环球信息网WWW页面处理方法和装置有效

专利信息
申请号: 201010586269.4 申请日: 2010-12-03
公开(公告)号: CN102486799A 公开(公告)日: 2012-06-06
发明(设计)人: 阮曙东;徐羽;彭默 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 谢安昆;宋志强
地址: 518044 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 环球 信息网 www 页面 处理 方法 装置
【说明书】:

技术领域

发明涉及互联网技术,特别涉及一种环球信息网(WWW,World Wide Web)页面处理方法和装置。

背景技术

随着宽带互联网的普及,互联网上的WWW页面显示的内容越来越丰富,但同时,多余的信息,如广告信息等也越来越多。当用户在有限大小的终端,如手机终端上浏览WWW页面时,这些多余的信息会给用户的浏览带来很大的不便,从而降低用户体验。

发明内容

有鉴于此,本发明的主要目的在于提供一种WWW页面处理方法,能够提升用户体验。

本发明的另一目的在于提供一种WWW页面处理装置,能够提升用户体验。

为达到上述目的,本发明的技术方案是这样实现的:

一种WWW页面处理方法,包括:

确定需要进行优化的网站;针对每个网络中各不同类型的WWW页面,分别为其生成对应的页面模板并进行保存;

不断地从各网站中抓取WWW页面,将抓取到的每个WWW页面分别与其对应的页面模板进行匹配,根据匹配结果从中过滤掉多余的超文本标记语言HTML数据,并将过滤后的WWW页面进行保存;

当接收到来自终端的WWW页面访问请求时,确定是否保存有终端请求访问的WWW页面对应的过滤后的WWW页面,如果是,则将对应的过滤后的WWW页面返回给终端。

一种WWW页面处理装置,包括:

第一处理单元,用于确定需要进行优化的网站;针对每个网络中各不同类型的WWW页面,分别为其生成对应的页面模板并进行保存;不断地从各网站中抓取WWW页面,将抓取到的每个WWW页面分别与其对应的页面模板进行匹配,根据匹配结果从中过滤掉多余的超文本标记语言HTML数据,并将过滤后的WWW页面进行保存;

第二处理单元,用于当接收到来自终端的WWW页面访问请求时,确定所述第一处理单元中是否保存有终端请求访问的WWW页面对应的过滤后的WWW页面,如果是,则从所述第一处理单元中获取对应的过滤后的WWW页面,并返回给终端。

可见,采用本发明的技术方案,根据页面模板从抓取到的WWW页面中过滤掉多余的HTML数据,即广告信息等,从而方便了用户浏览,提升了用户体验;而且,本发明所述方案实现起来简单方便,便于普及。

附图说明

图1为本发明方法实施例的流程图。

图2为本发明装置实施例的组成结构示意图。

具体实施方式

针对现有技术中存在的问题,本发明中提出一种全新的WWW页面处理方案,能够提升用户体验。

为使本发明的技术方案更加清楚、明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。

图1为本发明方法实施例的流程图。如图1所示,包括以下步骤:

步骤11:确定需要进行优化的网站。

在实际应用中,可由后台管理员来确定哪些网站需要进行优化(即按照后续方式对WWW页面进行过滤等),并利用确定出的网站组成一个网站链接列表,输入给后台处理系统。

理论上来说,网站链接列表中所包含的网站数越多越好,但是考虑到维护成本等因素,可只包含一些比较常用的网站。

步骤12:针对每个网络中各不同类型的WWW页面,分别为其生成对应的页面模板并进行保存。

本步骤中,针对网站链接列表中的每个网站X,分别进行以下处理:根据接收到的后台管理员指令,从网站X中分别获取不同类型的WWW页面各一个;将获取到的每个WWW页面分别分析构造成文档对象模型(DOM,Document Object Model)树,并根据接收到的后台管理员指令,删除每个DOM树中不需要保留的DOM节点;将每个经过删除处理后的DOM树分别转换为WWW页面,并作为页面模板进行保存。如何分析构造DOM树以及如何将DOM树转换为WWW页面均为现有技术。

在实际应用中,可开发一个相关插件安装在后台处理系统的浏览器,如火狐(FireFox)浏览器上;后续,后台管理员可在安装了插件的FireFox浏览器上访问不同网站的不同类型的WWW页面,具体来说,针对每个网站X中不同类型,如新闻类和BBS类的WWW页面,可分别从中随机选择一个WWW页面进行访问,并通过鼠标选择所访问的WWW页面中需要保留和需要删除的内容。所述插件即用于根据后台管理员的操作,相应地完成分析构造DOM树、删除DOM节点、将DOM树转换为WWW页面等功能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010586269.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top