[发明专利]一种网页收藏方法、装置及系统有效
申请号: | 201310603186.5 | 申请日: | 2012-03-31 |
公开(公告)号: | CN103617224B | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 曾强;张平;魏钦刚 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京华沛德权律师事务所11302 | 代理人: | 刘杰 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 收藏 方法 装置 系统 | ||
本发明专利申请是申请日为2012年3月31日、申请号为201210092944.7、名称为“一种网页收藏方法、装置及系统”的中国发明专利申请的分案申请。
技术领域
本发明涉及网络数据处理领域,特别是涉及一种网页收藏方法、装置及系统。
背景技术
收藏网页,是指互联网用户将感兴趣的网页进行保存,以便于随时能够重新阅读相关信息。
现有技术中一种网页收藏方法是:将用户浏览过的网页内容以快照的形式保存起来。具体的,该方法实现的过程中,根据用户所提供的待收藏网页的超链接,定位网页并对网页进行快照,将快照保存为网页收藏信息,用户还可以进一步对所收藏的网页标题、简介和标签等信息进行编辑。网页收藏成功后,用户可以随时进行查看。
但是,现有技术中的网页收藏方法,在快照的形式显示网页收藏内容时,也丢失大量的网页原始信息,很容易导致所述显示的收藏网页内容失去原有的排版格式,页面杂乱无章,可读性差。
发明内容
本发明的目的是提供一种网页收藏方法、装置及系统,能够较为完整的保存网页收藏页面内容。
为实现上述目的,本发明提供了如下方案:
一种网页收藏方法,包括:
接收到用户对所浏览的网页执行的收藏操作指令后,利用写入所述网页的用于抓取网页内容的脚本代码,抓取所述网页的内容描述信息;
对所述内容描述信息进行解析,根据解析结果抓取所述网页的内容;
对所抓取的网页内容进行保存。
其中,还包括:
当检测到所述用户所浏览的网页加载完成时,向用户所浏览的网页中写入用于抓取网页内容的脚本代码;
或者,
当接收到用户对所浏览的网页执行的收藏操作指令时,向用户所浏览的网页中写入用于抓取网页内容的脚本代码。
其中,所述向用户所浏览的网页中写入用于抓取网页内容的脚本代码,包括:
在用户所浏览的网页中添加内嵌框架;
在所述内嵌框架中写入所述脚本代码。
其中,所述抓取所述网页的内容描述信息,包括:
抓取所述网页的文档对象模型信息。
其中,所述对所抓取的网页内容进行保存,包括:
根据所述网页的文档对象模型信息,将所抓取的网页内容以结构化样式进行保存。
其中,所述根据解析结果抓取所述网页的内容包括:
根据预设的规则对网页内容中包含的不具有收藏意义的内容进行过滤,根据过滤结果抓取所述网页的内容。
其中,所述根据解析结果抓取所述网页的内容包括:
在网页内容包括图片的情况下,判断网页中的图片数量是否大于预设的阈值,如果是,则采用异步方式下载所述网页的图片内容。
其中,
在抓取网页的内容描述信息之后,还包括:将所述内容描述信息发送至服务器端设备;
所述服务器端设备对所述内容描述信息进行解析,根据解析结果抓取所述网页的内容,并对所抓取的网页内容进行保存。
一种网页收藏装置,包括:
描述信息抓取单元,用于接收到用户对所浏览的网页执行的收藏操作指令后,利用写入所述网页的用于抓取网页内容的脚本代码,抓取所述网页的内容描述信息;
网页内容抓取单元,用于对所述内容描述信息进行解析,根据解析结果抓取所述网页的内容;
网页内容保存单元,用于对所抓取的网页内容进行保存。
其中,还包括:
代码注入单元,用于当检测到所述用户所浏览的网页加载完成时,向用户所浏览的网页中写入用于抓取网页内容的脚本代码;或者,当接收到用户对所浏览的网页执行的收藏操作指令时,向用户所浏览的网页中写入用于抓取网页内容的脚本代码。
其中,所述代码注入单元,包括:
框架添加子单元,用于在用户所浏览的网页中添加内嵌框架;
代码写入子单元,用于在所述内嵌框架中写入所述脚本代码。
其中,所述描述信息抓取单元,具体用于:
在接收到用户的收藏操作指令后,利用预先写入的脚本代码,抓取所述网页的文档对象模型信息。
其中,所述网页内容保存单元,具体用于:
根据所述网页的文档对象模型信息,将所抓取的网页内容以结构化样式进行保存。
其中,所述网页内容抓取单元,具体用于:
根据预设的规则对网页内容中包含的不具有收藏意义的内容进行过滤,根据过滤结果抓取所述网页的内容。
其中,所述网页内容抓取单元,具体用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310603186.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:液体驱动的混合灭火装置
- 下一篇:用于景观树木/苗木养护的集成装置