[发明专利]基于Electron的文档离线系统及方法在审

申请号：	201910495872.2	申请日：	2019-06-05
公开（公告）号：	CN110309474A	公开（公告）日：	2019-10-08
发明（设计）人：	周晶;吴峰;郭伟	申请（专利权）人：	上海易点时空网络有限公司
主分类号：	G06F16/958	分类号：	G06F16/958;G06F16/957
代理公司：	北京卓唐知识产权代理有限公司 11541	代理人：	唐海力;李志刚
地址：	200125 上海市浦东***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文档离线云端服务器离线系统缓存开发效率入口地址网络拦截访问上传云端剔除页面拦截保存分类申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于Electron的文档离线系统，其特征在于，包括Electron、离线模块以及云端服务器；

所述Electron通过其网络拦截功能对待离线文档的入口地址进行拦并访问；所述离线模块对所述Electron拦截并访问的文档进行提取，对与文档无关的页面和资源进行剔除，同时对属于文档的资源进行本地化缓存，并保存至所述云端服务器中。

2.根据权利要求1所述的文档离线系统，其特征在于，所述离线模块通过Dom树或网页分割寻找正文块的算法进行文档提取。

3.根据权利要求2所述的文档离线系统，其特征在于，所述Dom树算法包括如下步骤：

1)利用开源包HTML Tidy处理HTML，更正其中错误或不规范的地方；

2)根据规范的HTML建立Dom树，然后递归遍历Dom树，比较并识别各种非文档的页面和资源，包括广告和非重要节点信息；并将其剔除；在本发明中，剔除广告信息需要建立经常更新的广告服务器列表；

3)剔除非文档的页面和资源后，将Dom树中剩余的内容作为文档内容从余下的树节点中提取缓存。

4.根据权利要求2所述的文档离线系统，其特征在于，所述网页分割寻找正文块算法具体为：首先利用HTML标签中的分隔线以及视觉信息对网页进行分割，在分割之后的各个块中寻找到正文块并进行缓存。

5.根据权利要求1所述的文档离线系统，其特征在于，还包括二次编辑模块；开发人员将离线后的文档导入所述二次编辑模块中，对所述离线后的文档进行二次编辑，并将二次编辑后的文档保存至所述云端服务器中。

6.根据权利要求5所述的文档离线系统，其特征在于，所述二次编辑模块采用ChromeDevTools Protocl。

7.一种应用权利要求1至6中任一项所述的文档离线系统的文档离线方法，其特征在于，包括步骤：

步骤1、通过Electron的网络拦截功能对待离线文档的入口地址进行拦并访问；

步骤2、通过离线模块对所述Electron拦截并访问的文档进行提取，对与文档无关的页面和资源进行剔除，同时对属于文档的资源进行本地化缓存，并保存至所述云端服务器中。

8.根据权利要求7所述的文档离线方法，其特征在于，还包括对所述离线文档的二次编辑步骤，具体为：通过所述二次编辑模块对所述离线后的文档进行二次编辑，并保存至所述云端服务器中。

9.根据权利要求7所述的文档离线方法，其特征在于，所述步骤2中，离线模块对所述Electron拦截并访问的文档进行提取离线采用的是Dom树或网页分割寻找正文块的算法。

10.根据权利要求9所述的文档离线方法，其特征在于，所述Dom树算法包括如下步骤：1)利用开源包HTML Tidy处理HTML，更正其中错误或不规范的地方；2)根据规范的HTML建立Dom树，然后递归遍历Dom树，比较并识别各种非文档的页面和资源，包括广告和非重要节点信息；并将其剔除；在本发明中，剔除广告信息需要建立经常更新的广告服务器列表；3)剔除非文档的页面和资源后，将Dom树中剩余的内容作为文档内容从余下的树节点中提取缓存；

所述网页分割寻找正文块算法具体为：首先利用HTML标签中的分隔线以及视觉信息对网页进行分割，在分割之后的各个块中寻找到正文块并进行缓存。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海易点时空网络有限公司，未经上海易点时空网络有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910495872.2/1.html，转载请声明来源钻瓜专利网。

上一篇：融合身份标识和投票行为监控的防刷票方法及装置
下一篇：一种页面展现方法、装置、终端设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Electron的文档离线系统及方法在审

专利文献下载