[发明专利]一种基于源文件的word图文格式编排系统及其实现方法在审
申请号: | 201711379063.2 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108052496A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 吴建州;李勇波;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | G06F17/25 | 分类号: | G06F17/25 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 源文件 word 图文 格式 编排 系统 及其 实现 方法 | ||
本发明涉及计算机应用技术领域,特别是一种基于源文件的word图文格式编排系统及其实现方法。本发明的系统由源文件解析器、动态数据组装器和文档编排器构成。源文件解析器使用POI读取源文件获取文本格式标签、图片格式标签和示例片段生成格式标签库;动态数据组装器将动态数据中的图片流和文本数据按格式标签进行分组生成标签数据哈希图;文档编排器复制源文件生成新文档,使用POI读取新文档格式匹配标签数据哈希图,将匹配成功的图片流和文本数据写入新文档对应位置,最终完成新文档编排。本发明具有扩展性好、适用范围广等特点,可有效地应用于多种需要对word文档自动编排的系统中。
技术领域
本发明涉及计算机应用技术领域,特别是一种基于源文件的word图文格式编排系统及其实现方法。
背景技术
word文档编辑、排版工作是件即费时又费力且细致的工作,重复类似的文档开发工作需要花费较多人力资源及时间。常规的word文档编排通过定义参数变量进行Range匹配替换或者转成XML格式匹配替换,在word版本通用性、图片处理及模板格式的完整保留等方面存在不足且解析替换操作复杂。这时候更需要一种灵活度高且适用范围广的方法,可以快速响应业务需求,实现快速开发。
发明内容
本发明解决的技术问题之一在于提供一种基于源文件的word图文格式编排系统,灵活地实现word文档的编辑、排版。
本发明解决的技术问题之二在于提供一种基于源文件的word图文格式编排系统的实现方法。
本发明解决上述技术问题之一的技术方案是:
所述的系统包括源文件解析器、动态数据组装器和文档编排器;
所述的源文件解析器,使用POI读取源文件获取文本格式标签、图片格式标签和示例片段,然后生成格式标签库;
所述的动态数据组装器,将动态数据中的图片流和文本数据按格式标签进行分组生成标签数据哈希图;
所述的文档编排器,复制源文件生成新文档,使用POI读取新文档格式匹配标签数据哈希图,将匹配成功的图片流和文本数据写入新文档对应位置,完成新文档编排。
所述的文本格式标签包括段落序号、表格序号、字体系列码、字号、颜色码和样式序号六种元素,其中样式序号是同一种样式在不同段落或序列的排序号。
所述的图片格式标签包括段落序号、表格序号、序列序号和图片序号四种元素。
本发明解决上述技术问题之二的技术方案是:
所述的方法具体步骤如下:
第一步,使用POI按段落读取源文件,获取段落下所有序列,遍历序列判断当前是文本序列还是图片序列;
第二步,针对文本序列获取格式包括字体系列码、字号和颜色码,判断和段落格式哈希图中上一个格式是否相同,如果不同则生成新格式并加入到段落格式哈希图,如果相同则将文本内容累加到段落格式哈希图对应的值中;针对图片序列根据段落序号、序列序号和图片序号生成图片格式标签;
第三步,使用POI按表格读取源文件,获取表格下所有单元格,遍历单元格获取所有序列,遍历序列判断当前是文本序列还是图片序列;
第四步,针对文本序列获取格式包括字体系列码、字号和颜色码,判断和表格格式哈希图中上一个格式是否相同,如果不同则生成新格式并加入到表格格式哈希图,如果相同则将文本内容累加到表格格式哈希图对应的值中;针对图片序列根据表格序号、序列序号和图片序号生成图片格式标签;
第五步,截取段落格式哈希图和表格格式哈希图中的文本值,生成示例片断;
第六步,汇总段落格式哈希图、表格格式哈希图和图片格式标签生成格式标签库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711379063.2/2.html,转载请声明来源钻瓜专利网。