[发明专利]一种DOC/DOCX格式的流式文件转换成OFD格式的版式文件的方法和装置有效

专利信息
申请号: 201910091864.1 申请日: 2019-01-30
公开(公告)号: CN109829139B 公开(公告)日: 2023-04-18
发明(设计)人: 韩光;冯文化;兰静 申请(专利权)人: 中国软件与技术服务股份有限公司
主分类号: G06F40/151 分类号: G06F40/151
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 邱晓锋
地址: 100081 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 doc docx 格式 文件 转换 ofd 版式 方法 装置
【说明书】:

发明涉及一种DOC/DOCX格式的流式文件转换成OFD格式的版式文件的方法和装置。该方法的步骤包括:通过流式排版引擎生成与待转换的DOC/DOCX格式的流式文档对应的流式文档内存模型;通过PDF转换引擎将生成的流式文档内存模型转换成PDF文档内存模型;采用文档解析排版技术将生成的PDF文档内存模型转换为OFD文档内存模型;利用生成的OFD文档内存模型输出OFD文档。本发明可以直接将DOC/DOCX流式文档转换为OFD版式文档,转换后的OFD版式文档既符合版式文件标准又能保持DOC/DOCX流式文档的原版样式。

技术领域

本发明属于计算机领域,涉及一种文档转化方法,尤其涉及一种DOC/DOCX格式的流式文档转换成OFD格式的版式文档的方法和装置。

背景技术

DOC/DOCX是一种流式文档格式,是目前应用最为广泛的流式文档格式,也是日常工作中大多数第一手文件的格式。许多历史遗留文件也多为DOC/DOCX格式。

OFD是一种版式文档格式,全称为开放式版式文档(Open Fixed-layoutDOCument),是国家版式文档格式规范。版式文档是电子文件应用的一个重要门类,是常用的基础办公软件之一。其具有原版原式的呈现特点,即阅读显示与印刷效果一致,真实地保持了文档产生之初的文字、图表、色彩等版式信息,具有高保真的显示和打印效果。

国家标准于2017年5月1日开始实施,未来电子公文、电子发票等都将以OFD格式的版式文件存在。DOC/DOCX格式流式文件转换OFD格式的版式文件的应用需求将空前扩大。

目前市面上缺少公开免费的转换工具,转换技术不成熟也成为急需解决的问题。有关OFD格式转换的公开研究成果很少,并且多是由PDF版式文档格式转换成OFD格式,不能直接对应用最广泛的DOC/DOCX流式文档格式进行转换。

虽然DOC以及OFD文件相关标准已经开放,但由于流式文件缺少相应坐标信息,很难直接转换为OFD版式文件。

一般的流式文件转版式文件的方法,往往采用内置的规则或语法,难以灵活修改,不能适用于DOC/DOCX多变的结构,算法封闭不开放。

综上,一种DOC/DOCX格式的流式文档转换成OFD格式的版式文档的方法,势在必行,显得尤为重要。

发明内容

针对目前尚未发现流式文件直接转化为OFD版式文件的工具和流式文件缺少相应坐标信息的问题,本方法首先将流式文件转化为具有坐标信息的PDF版式文件,再将PDF版式文件转化为OFD版式文件。采用本方法后,保证了DOC/DOCX流式文件成功转换为OFD版式文件。

本发明所采用的技术方案是:

一种DOC/DOCX格式的流式文档转换成OFD格式的版式文档的方法,包括以下步骤:通过流式排版引擎,生成与待转换的DOC/DOCX格式的流式文档对应的流式文档内存模型;

通过PDF转换引擎,将生成的流式文档内存模型转换成PDF文档内存模型;

采用文档解析排版技术,将生成的PDF文档内存模型转换为OFD文档内存模型;

利用生成的OFD文档内存模型输出OFD文档,通知用户转换结果。

进一步地,所述流式排版引擎将内存中的流式文档导入到进程地址空间中,将流式文档切入到流式文档内存模型,以便于对流式文档的处理。

进一步地,所述PDF转换引擎利用PDF虚拟打印机技术将流式文档内存模型转化为PDF文档内存模型。

进一步地,所述采用文档解析排版技术将生成的PDF文档内存模型转换为OFD文档内存模型,包括:

1)以对象为基本单位,利用PDF解析器对PDF文档内存模型进行解析得到其对应的抽象语法树;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国软件与技术服务股份有限公司,未经中国软件与技术服务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910091864.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top