[发明专利]文档的协同转换方法及系统在审
申请号: | 201610035757.3 | 申请日: | 2016-01-19 |
公开(公告)号: | CN105718554A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 李政放;常治国;赵慧;李跃 | 申请(专利权)人: | 深圳市天朗时代科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国;苏磊 |
地址: | 518057 广东省深圳市南山区科技园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 协同 转换 方法 系统 | ||
技术领域
本发明涉及文档转换技术领域,尤其涉及一种文档的协同转换方法及系统。
背景技术
目前,存在着巨量的纸质书籍尚未提供电子书版本,纸质书籍转化为统一的电子书格式,除了创造直接的商业价值外,也更便于文化的传播、交流和继承,并能有效防止由于纸张损坏而造成的遗失。另外,现存大量的PDF扫描版文档需要转为更易于阅读的其他电子书格式,电子书格式的统一是历史发展的必然趋势。如何将市面上巨量的现存纸质书籍以及PDF格式书籍,转为包括ePub、mobi、doc、DocBook在内的各种电子书格式则成为一个具有挑战意义和紧迫性的问题。
由于目前市场上待转为电子书的文档数量非常庞大,当前电子书转换系统基本都是单任务转换系统,面临的主要问题是:一方面待转换文档数量相当庞大且转换成本较高,采用的单任务转换系统转换效率及质量低;另一方面由于纠错、排版等问题,转换工作无法完全由系统自动实现,部分工作必须依靠人工实现,由单个人实现整个文档所有的校对工作,其工作效率低,需要人工付出更多的劳动。
发明内容
本发明的主要目的在于提供一种文档的协同转换方法及系统,旨在提高文档转换的效率及质量。
为实现上述目的,本发明提供了一种文档的协同转换方法,包括:
多个客户端分别向服务端发送创建用户的请求,或者同一客户端统一向服务端分别发送多个客户端创建用户的请求;
服务端根据所述请求创建多个用户及为各用户分配对应的角色;
服务端接收客户端上传的文档,对所述文档进行拆分,对拆分后的文档依次进行渲染及光学字符识别;
各客户端从服务端获取经光学字符识别后的文档进行结构化标引,并
根据各自对应的用户及角色,接收用户指令对进行结构化标引后的文档进行相应的校对,将完成校对的文档上传至服务端;
服务端在接收到各客户端上传的所有完成校对的拆分文档后进行合并。
可选地,所述服务端在接收到各客户端上传的所有完成校对的拆分文档后进行合并之后包括:
客户端从服务端获取合并后的文档,对合并后的文档进行完整性校对。
可选地,所述服务端接收客户端上传的文档,对所述文档进行拆分,对拆分后的文档依次进行渲染及光学字符识别包括:
所述服务端接收客户端上传的文档,对所述文档进行拆分,对拆分后的文档进行渲染,在对渲染后的文档进行光学字符识别的过程中,将不同的语言文字进行分开识别,并将进行光学字符识别的文档中识别错误的文字进行存储,以在识别的过程中对所述识别错误的文字进行标识。
可选地,所述服务端与各客户端之间通过https协议进行通信,所述客户端所有下载或上传的数据以加密的方式存储在内存和/或客户端的临时文件中,所述临时文件的加密秘钥存在所述服务器并通过https协议发送至所述客户端。
可选地,所述各客户端从服务端获取经光学字符识别后的文档进行结构化标引,并根据各自对应的用户及角色,接收用户指令对进行结构化标引后的文档进行相应的校对,将完成校对的文档上传至服务端之前包括:
客户端获取用户的身份验证信息,在所述身份验证信息通过验证后,从所述服务端获取经光学字符识别后的文档。
可选地,所述接收用户指令对进行结构化标引后的文档进行相应的校对包括:
在校对界面同时显示多个对照视图,接收用户指令对进行结构化标引后的文档进行相应的校对。
此外,为实现上述目的,本发明还提供了一种文档的协同转换系统,所述文档的协同转换系统包括服务端和多个客户端,其中,
客户端,用于向服务端发送创建用户的请求;
服务端,用于根据所述请求创建多个用户及为各用户分配对应的角色;
服务端,还用于接收客户端上传的文档,对所述文档进行拆分,对拆分后的文档依次进行渲染及光学字符识别;
客户端,还用于从服务端获取经光学字符识别后的文档进行结构化标引;
客户端,还用于根据各自对应的用户及角色,接收用户指令对进行结构化标引后的文档进行相应的校对,将完成校对的文档上传至服务端;
服务端,还用于在接收到各客户端上传的所有完成校对的拆分文档后进行合并。
可选地,所述客户端还用于,从服务端获取合并后的文档,对合并后的文档进行完整性校对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市天朗时代科技有限公司,未经深圳市天朗时代科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610035757.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电能表远程查询系统
- 下一篇:一种呈现浏览器主体内容的方法