[发明专利]网页快照保存方法在审
申请号: | 201811113487.9 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109271092A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 石松;黄利 | 申请(专利权)人: | 真相网络科技(北京)有限公司;石松 |
主分类号: | G06F3/0485 | 分类号: | G06F3/0485;G06F3/0484;G06F16/955 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 王金宝 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 快照 滚动 网页快照 页面 保存 数组 网页 光标移动 图片保存 网页内容 用户维护 加载 拼接 网站 固化 申请 图片 | ||
本申请涉及一种网页快照保存方法,该方法包括:接收到URL请求后,打开网页;从页面顶部以第一滚动速度滚动至页面底部,加载全部网页;光标移动至页面顶部以第二滚动速度,滚动长度h进行重新滚动,每次滚动进行快照并将快照图片保存至图片数组;将图片数组中快照图片进行拼接,完成保存网页快照操作。本申请中克服传统快照手段不能保存超长网页快照的问题,从而实现对超长网页内容进行固化,方便用户维护网站。
技术领域
本申请涉及计算机网络技术领域,尤其是一种网页快照保存方法。
背景技术
网页快照是指搜索引擎在收录网页时,对网页进行纯文本备份,存在直接的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将当时所抓取并保存的网页内容展现在页面中。因此,网页快照为人们保存与浏览网页提供极大便利。相关技术中,使用快照工具webshot实现网页动态加载,并完成完整快照,通过浏览器打开网页方式,对于短网页能正常加载与打开,但不支持超长网页快照。而超长网页往往是用户需要快照的网页,因此,如何设计一种可以保存超长网页快照的方法成为相关领域技术人员重点解决的问题。
发明内容
为至少在一定程度上克服传统快照手段不能保存的超长网页快照的问题,本申请提供一种网页快照保存方法,包括:
接收到URL请求后,打开网页;
从页面顶部以第一滚动速度滚动至页面底部,以加载全部网页;
光标移动至页面顶部以第二滚动速度,滚动长度h进行重新滚动,每次滚动进行快照并将快照图片保存至图片数组;
将图片数组中快照图片进行拼接,完成保存网页快照操作。
进一步的,所述打开网页,包括:
预先设置chrome浏览器参数;
根据所述参数声明chromedirver;
打开chrome浏览器,模拟真实浏览器打开网页。
进一步的,还包括:通过selenium加载chrome的方式打开chrome浏览器,模拟真实浏览器打开网页。
进一步的,所述第一滚动速度小于所述第二滚动速度。
进一步的,所述滚动长度h,计算方法包括:
h=上一周期滚动到达位置h1+图片高度h2-图片头部高度h3-图片底部高度h4;
所述图片头部高度h3、图片底部高度h4为预设值;所述图片高度h2通过第一JavaScript获取。
进一步的,所述每次滚动进行快照并将快照图片保存至图片数组,包括:
利用第二JavaScript获取网页最大长度;
根据长度不同,确定缩放比例;
将所述快照图片按所述缩放比例进行缩放后保存至图片数组。
进一步的,所述利用第二JavaScript获取网页最大长度,包括:重复多次从页面顶部以第一滚动速度滚动至页面底部,以获取网页最大长度。
进一步的,将快照图片保存至图片数组包括:用流形式读取快照图片赋值给图片数组,并删除快照图片。
进一步的,还包括:完成图片数组中快照图片拼接得到全快照图片,在所述全快照图片加上水印时间戳。
本申请的实施例提供的技术方案可以包括以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于真相网络科技(北京)有限公司;石松,未经真相网络科技(北京)有限公司;石松许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811113487.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文件管理系统及方法
- 下一篇:一种数字标本立体展示方法及装置