[发明专利]判断网页更新的方法和装置及网站同步的方法和装置无效

专利信息
申请号: 201010254600.2 申请日: 2010-08-13
公开(公告)号: CN102375830A 公开(公告)日: 2012-03-14
发明(设计)人: 贾晓建;王主龙;孟遥;于浩;王新文 申请(专利权)人: 富士通株式会社
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 朱胜;俞波
地址: 日本神*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 判断 网页 更新 方法 装置 网站 同步
【说明书】:

技术领域

发明总体上涉及互联网信息处理领域,尤其涉及一种判断网页是否更新的方法和装置以及用于与网站同步的方法和装置。

背景技术

随着因特网和电子技术的飞速发展,人们不再受地域的限制,可以方便的在网上交换各种各样的信息。在大量用户的参与之下,网站(比如论坛、博客、新闻网站等)的网页中存在大量的有用信息,这些信息不管对于个人,而且对于企业都有很好的使用价值。

为了及时的获得网站中的信息,需要下载网站中的页面以进行信息提取。然而,网站中的信息总是在变化,因此需要提供一种可以与网站同步的技术手段以便可以与网站同步地提取信息。

为了实现与网站同步,首先需要判断网站中的网页是否有更新,在判定网页有更新的情况下才下载有更新的页面,这样可以实现与网站同步以保证信息提取的实时性。

在现有技术中,根据网页的最后修改时间来判断网页是否有更新。例如,可以利用http协议头或MD5数字签名来判断网页是否有更新。

发明内容

在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。

本发明的一个目的在于提供一种判断网页更新的方法和装置,其可以针对动态网页(例如,论坛中的网页、博客中的网页、包含评论的新闻网页等)进行简单高效的网页更新判断。

本发明的另一个目的在于提供一种与网站同步的方法和装置,其可以对包括动态网页的网站(例如,论坛、博客、具有评论功能的新闻网站等)进行同步更新,从而保证了网站信息获取的实时性。

为了实现上述目的,根据本发明的一个方面,首先,获得网页中的超链接的数目;接着,根据获得的超链接的数目和最近一次记录的该网页中的超链接数目来判断网页是否更新。这样,可以以简单有效的方式来判断网页是否有更新。

此外,根据本发明的另一个方面,可以先基于网站中网页的超链接的数目来判断网站中的网页是否更新;在判定网页有更新的情况下,则重新下载该网页。这样,可以以简单有效的方式实现了与网站的同步。

通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。

附图说明

本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。在附图中:

图1示出了根据本发明一个实施例的判断网页是否更新的方法的流程图;

图2示出了根据本发明一个实施例的基于超链接数目来判断网页是否更新的处理的流程图;

图3示出了根据本发明一个实施例的用于与网站同步的方法的流程图;

图4示出了根据本发明一个实施例的用于判断网页是否更新的装置的示意图;

图5示出了根据本发明一个实施例的用于与网站同步的装置的示意图;以及

图6是其中可以实现根据本发明实施例的方法和/或装置的通用个人计算机的示例性结构的框图。

具体实施方式

在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。

在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。

图1示出了根据本发明一个实施例的判断网页是否更新的方法的流程图。

如图1所示,在步骤S102处,获得网页中的超链接数目。

接着,在步骤S104处,基于超链接的数目来判断网页是否有更新。

这样,实现了根据本发明实施例的判断网页是否更新的方法。这种基于超链接数目来判断网页是否更新的处理相对简单,涉及较少的计算量,因此,可以实现简单高效的网页更新判断。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010254600.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top