[发明专利]一种基于源文件的word图文格式编排系统及其实现方法在审
申请号: | 201711379063.2 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108052496A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 吴建州;李勇波;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | G06F17/25 | 分类号: | G06F17/25 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 源文件 word 图文 格式 编排 系统 及其 实现 方法 | ||
1.一种基于源文件的word图文格式编排系统,其特征在于:所述的系统包括源文件解析器、动态数据组装器和文档编排器;
所述的源文件解析器,使用POI读取源文件获取文本格式标签、图片格式标签和示例片段,然后生成格式标签库;
所述的动态数据组装器,将动态数据中的图片流和文本数据按格式标签进行分组生成标签数据哈希图;
所述的文档编排器,复制源文件生成新文档,使用POI读取新文档格式匹配标签数据哈希图,将匹配成功的图片流和文本数据写入新文档对应位置,完成新文档编排。
2.根据权利要求1所述的系统,其特征在于:所述的文本格式标签包括段落序号、表格序号、字体系列码、字号、颜色码和样式序号六种元素,其中样式序号是同一种样式在不同段落或序列的排序号。
3.根据权利要求1或2所述的系统,其特征在于:所述的图片格式标签包括段落序号、表格序号、序列序号和图片序号四种元素。
4.一种根据权利要求1、2或3任一项所述的系统的实现方法,其特征在于:所述的方法具体步骤如下:
第一步,使用POI按段落读取源文件,获取段落下所有序列,遍历序列判断当前是文本序列还是图片序列;
第二步,针对文本序列获取格式包括字体系列码、字号和颜色码,判断和段落格式哈希图中上一个格式是否相同,如果不同则生成新格式并加入到段落格式哈希图,如果相同则将文本内容累加到段落格式哈希图对应的值中;针对图片序列根据段落序号、序列序号和图片序号生成图片格式标签;
第三步,使用POI按表格读取源文件,获取表格下所有单元格,遍历单元格获取所有序列,遍历序列判断当前是文本序列还是图片序列;
第四步,针对文本序列获取格式包括字体系列码、字号和颜色码,判断和表格格式哈希图中上一个格式是否相同,如果不同则生成新格式并加入到表格格式哈希图,如果相同则将文本内容累加到表格格式哈希图对应的值中;针对图片序列根据表格序号、序列序号和图片序号生成图片格式标签;
第五步,截取段落格式哈希图和表格格式哈希图中的文本值,生成示例片断;
第六步,汇总段落格式哈希图、表格格式哈希图和图片格式标签生成格式标签库;
第七步,根据格式标签库将动态数据中的图片流和文本数据进行分组,生成标签数据哈希图;
第八步,复制源文件生成新文档,使用POI按段落读取新文档,获取段落下所有序列,合并相同格式序列,匹配标签数据哈希图,将匹配成功的图片流和文本数据写入新文档对应位置;
第九步,使用POI按表格读取新文档,获取表格下所有单元格,遍历单元格获取所有序列,合并相同格式序列,匹配标签数据哈希图,将匹配成功的图片流和文本数据写入新文档对应位置,最终完成新文档编排。
5.根据权利要求4所述的方法,其特征在于:所述的第一步与第二为一组;第三步与第四为一组;两组顺序可以互换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711379063.2/1.html,转载请声明来源钻瓜专利网。