[发明专利]应用于网页快照的数据处理方法及系统有效
申请号: | 201510800996.9 | 申请日: | 2015-11-19 |
公开(公告)号: | CN105302672B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 梁可尊;王伟;赵金鑫;廖继逢;胡立强;刘威;胡宗维;刘颖莲;李响;王明龙 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 温旭;郝传鑫 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 网页快照 数据处理 方法 系统 | ||
本发明公开一种应用于网页快照的数据处理方法及系统,其中,所述方法包括:获取网页的网页数据;根据所述网页数据和所述网页的前版快照数据对比确定二者中表达相同网页内容的数据,所述前版快照数据的时间早于所述网页数据的时间;将所述网页数据中表达所述相同网页内容的数据替换为用于标志这些数据的编码得到当前版快照数据。采用本发明,能够根据用户信息对用户进行分析,从而向用户推荐符合用户需求的更新内容;此外,根据用户需求下载更新内容,不仅满足了用户需求,还能节省用户存储空间,避免流量或宽带资源的浪费,提高用户体验。
技术领域
本发明涉及数据处理领域,更具体地,涉及一种应用于网页快照的数据处理方法及系统。
背景技术
随着互联网的爆发性发展,互联网应用系统所存储的数据以及网页数量在不断增加。随着网页个性化展示以及网页内容的不断完善与修改,网页往往更新迭代形成多个历史版本。互联网为了可以便捷查看网页修改前后的对比,往往将历史快照数据存储于系统中。传统的网页历史快照主要用于网络搜索引擎中,其目的是为了形成搜索索引,快速检索目标网页。
现有的网页修改历史快照数据存储方法主要是使用全量存储的方法,即将前一个版本的网页与修改后的网页完整的保存下来。随着时间的推移和网页修改次数不断增多,互联网系统所需要存储的数据也会持续较快的增长,这对于网页数据频繁修改的互联网系统来说,大大增加了对存储空间的需求以及处理的成本。同时,随着电子商务系统的发展,由于电子商务系统对于用户个性化设计具有较高需求的特性,对于不同等级的会员展示的页面元素可能不一样,如折扣、价格、优惠信息、运费信息、赠品信息等,加重了网页版本差别的形成众多网页历史快照版本的问题。
现有的网页历史快照技术主要应用于网络搜索引擎,一般采用全量保存网页历史快照的方法,导致互联网系统需要花费大量的存储空间来存储网页快照数据,特别是在爆发性增长的电子商务系统中,存储空间的需求及成本负担较大。
发明内容
为解决上述技术问题,本发明提供了一种应用于网页快照的数据处理方法及数据处理系统,能够大大减少存储网页历史快照所需的存储空间,降低处理成本,例如,降低网页修改历史快照数据所需的成本。
一方面,本发明实施例提供了一种应用于网页快照的数据处理方法,包括:
获取网页的网页数据;
根据所述网页数据和所述网页的前版快照数据对比确定二者中表达相同网页内容的数据,所述前版快照数据的时间早于所述网页数据的时间;
将所述网页数据中表达所述相同网页内容的数据替换为用于标志这些数据的编码得到当前版快照数据。
另一方面,本发明实施例提供一种应用于网页快照的数据处理系统,包括:
数据获取模块,用于获取网页的网页数据;
数据对比模块,用于根据所述网页数据和所述网页的前版快照数据对比确定二者中表达相同网页内容的数据,所述前版快照数据的时间早于所述网页数据的时间;
数据替换模块,用于将所述网页数据中表达所述相同网页内容的数据替换为用于标志这些数据的编码得到当前版快照数据。
采用本发明实施例,具有以下优点:
1)通过将网页数据中表达相同网页内容的数据替换为相应的编码,不仅能有效地存储网页的历史快照数据,还能够大大节省快照数据的存储空间,降低成本;
2)通过预先保存多个版本的快照数据,有利于旧版快照数据的查询与获取;
3)通过建立用户编码与网页名称编码二者与当前版快照数据的对应关系,有利于分用户地保存历史快照数据,满足用户的个性化需求,特别适用于在电商平台中为用户提供个性化的页面展示。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510800996.9/2.html,转载请声明来源钻瓜专利网。