[发明专利]对UOF文档进行分块转换的方法有效
申请号: | 202111388477.8 | 申请日: | 2021-11-22 |
公开(公告)号: | CN114218896B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 余丹;周韩钰;邢智涣 | 申请(专利权)人: | 慧之安信息技术股份有限公司 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/205 |
代理公司: | 北京广技专利代理事务所(特殊普通合伙) 11842 | 代理人: | 安琪 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | uof 文档 进行 分块 转换 方法 | ||
本发明提供了对UOF文档进行分块转换的方法,其能够对解压后的ODF文档进行分块切分处理,以此全面逐一地获得所有XML文档,并对每个XML文档进行解析处理和样式分析,从而得到相应的文档属性数据;接着基于该文档属性数据转换得到与ODF文档对应的UOF文档;最后标定该UOF文档存在的文档内容错误数据并进行备份,以及对该UOF文档进行打包压缩处理,这样能够全面地针对所有XML文档进行逐一转换,从而避免发生遗漏转换或者重复转换的情况以及提高UOF文档的转换可靠性。
技术领域
本发明涉及文档转换处理的技术领域,特别涉及对UOF文档进行分块转换的方法。
背景技术
UOF(Uified office document Format)文档是基于XML的开放式文档格式,其又被称作“标文通”文档。在对UOF文档进行转换的过程中存在文档解析出错以及转换内容无法打开的问题。同时现有的UOF文档转换技术并不能针对其中所有XML文档进行逐一的转换,这导致可能存在遗漏转换或者重复转换的情况发生,从而严重地降低UOF文档的转换效率和转换可靠性。
发明内容
针对现有技术存在的缺陷,本发明提供对UOF文档进行分块转换的方法,其包括对ODF文档进行解压处理,从而得到相应的解压ODF文档;对解压ODF文档进行分块切分,以此获得其中包含的若干XML文档;再对XML文档进行解析处理,从而得到相应的文档解析输出结果;接着对文档解析输出结果进行文档内容纠错后,对文档解析输出结果进行样式分析,从而得到关于ODF文档的文档属性数据;再对文档属性数据依次进行区分预处理和转换处理,从而得到与ODF文档对应的UOF文档;最后对UOF文档进行文档内容检查与批注处理,以此标定其中存在的文档内容错误数据;将文档内容错误数据上传至用户端进行备份后,对UOF文档进行打包压缩处理;可见,该对UOF文档进行分块转换的方法能够对解压后的ODF文档进行分块切分处理,以此全面逐一地获得所有XML文档,并对每个XML文档进行解析处理和样式分析,从而得到相应的文档属性数据;接着基于该文档属性数据转换得到与ODF文档对应的UOF文档;最后标定该UOF文档存在的文档内容错误数据并进行备份,以及对该UOF文档进行打包压缩处理,这样能够全面地针对所有XML文档进行逐一转换,从而避免发生遗漏转换或者重复转换的情况以及提高UOF文档的转换可靠性。
本发明提供对UOF文档进行分块转换的方法,其特征在于,其包括如下步骤:
步骤S1,对ODF文档进行解压处理,从而得到相应的解压ODF文档;对所述解压ODF文档进行分块切分,以此获得其中包含的若干XML文档;再对所述XML文档进行解析处理,从而得到相应的文档解析输出结果;
步骤S2,对所述文档解析输出结果进行文档内容纠错后,对所述文档解析输出结果进行样式分析,从而得到关于所述ODF文档的文档属性数据;再对所述文档属性数据依次进行区分预处理和转换处理,从而得到与所述ODF文档对应的UOF文档;
步骤S3,对所述UOF文档进行文档内容检查与批注处理,以此标定其中存在的文档内容错误数据;将所述文档内容错误数据上传至用户端进行备份后,对所述UOF文档进行打包压缩处理;
进一步,在所述步骤S1中,对ODF文档进行解压处理,从而得到相应的解压ODF文档具体包括:
基于开源代码Zip Utils设计形成文档解压缩模块,并将所述文档解压模块上传至计算机终端中运行驱动,从而使所述文档解压缩模块对所述ODF文档进行解压处理,以此得到相应的解压ODF文档;
进一步,在所述步骤S1中,对所述解压ODF文档进行分块切分,以此获得其中包含的若干XML文档具体包括:
对所述解压ODF文档进行扫描,以此确定所述解压ODF文档包含的所有XML文档各自的文档起止数据部分;
根据所述XML文档各自的文档起止数据部分,对所述解压ODF文档进行分块切分,从而获得所述解压ODF文档包含的所有XML文档;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧之安信息技术股份有限公司,未经慧之安信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111388477.8/2.html,转载请声明来源钻瓜专利网。