[发明专利]WORD内容批量拷贝到基于S1000D标准DM的快速转换方法有效

专利信息
申请号: 202110316627.8 申请日: 2021-03-25
公开(公告)号: CN112699641B 公开(公告)日: 2021-07-20
发明(设计)人: 孙国防;蒋巍;孙浩 申请(专利权)人: 南京国睿信维软件有限公司
主分类号: G06F40/151 分类号: G06F40/151;G06F40/186
代理公司: 南京苏创专利代理事务所(普通合伙) 32273 代理人: 凤婷
地址: 210013 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: word 内容 批量 拷贝 基于 s1000d 标准 dm 快速 转换 方法
【权利要求书】:

1.WORD内容批量拷贝到基于S1000D标准DM的快速转换方法,其特征在于:包括如下步骤:

步骤1:文档html化:对文档全文进行html标签语言的文本化,通过键盘“CTRL+C/CTRL+V”触发复制/粘贴命令,将文档内容复制到剪切板中,设置文档数据格式为html格式,通过Transformer转换对象获取剪切板中html格式内容,输出html标签语言文本;

步骤2:根据步骤1中底层html数据的“xmlns:w=urn:schemas-microsoft-com:office:WORD”标签语言文本判断是否来源于word文档,若是,则进入步骤3,若不是,则调用普通转换操作;

步骤3:核对html标签语言文本是否为已注册的word粘贴命令,若否,则把word粘贴命令注册到缓存的命令集合中,然后进入步骤4,若是,则直接进入步骤4;

步骤4:判断当前光标是否定位在编辑区节点中,若否,则警告提示,若是,则进入步骤5;

步骤5:获取word需要粘贴的对象,执行粘贴命令,并且初始化xslt样式模板;

步骤6:启动多线程操作,对粘贴后的html标签语言文本进行裁剪、调整或者删除不必要的内容,为转换S1000D节点做准备,多线程操作的具体执行过程为:

步骤6.1:把html标签语言文本中字符串转成Document对象进行解析,并删除html标签语言文本中的命名空间及注释内容,再把图片内容下载到本地临时文件夹,普通图片用png格式保存,VISIO格式用EMF压缩格式保存,文件命名格式为“image”+编号;

步骤6.2:删除html标签语言文本中底层对应的meta多余标签内容,删除全局字体相关的样式;

步骤6.3:删除原word纯文本内容样式、有序列表、无序列表样式及文本布局格式,修改语言为“zh-CN”格式;

步骤6.4:删除底层原word文档全文中的链接样式;

步骤6.5:根据原word文档底层表格列宽,修改为用百分比表示列宽,增加处理指令,用来预处理按照S1000D标准标签表示的表格;

步骤6.6:修改图片标签,把原word文档中的底层img标签改为figure,并且增加属性“class='figcaption'”来表示图片,若没有加入此属性的,则默认作为图标;

步骤6.7:根据原word文档中的底层p标签的属性“class='MsoNormal'”判断底层p标签是有序列表还是无序列表,若是有序列表,则把p标签转成对应的有序“olli”标签,若是无序列表,则把p标签转成对应的无序“ulli”标签;

步骤6.8:处理图注或者表注,根据原word文档中的图片或者表格标签中的“class='figcaption'”或者“class='caption'”来填充图片或者表格的标题;

步骤6.9:预处理标题标签,根据原word文档全文中的底层标签,一级标题标签“h1/h1”转成对应的“div class='section1'h1h1/div”标签,在后期根据“class='section1'”转成对应的S1000D节点或者步骤标签;

步骤6.10:删除原word文档中的底层空文本标签、span标签及样式,把“b、big、cite、em、i、small、strong和u”标签中的内容替换到外层p标签中,并且删除“b、big、cite、em、i、small、strong和u”标签及其样式;

步骤6.11:根据步骤6.1-6.10,生成对应的标签内容,作为转成S1000D标签的输入原Xml内容;

步骤6.12:将步骤6.11生成的输入原Xml内容解析转成“Document”对象,为转成标准S1000D内容做准备;

步骤7:若当前线程能在1秒内处理完源数据,则不弹出日志对话框,若超过1秒还没有执行完,则通过thread.join(1000)结束当前线程,弹出操作日志对话框;

步骤8:根据xslt样式文件路径获取样式模板,若缓存中有样式模板信息,则默认样式模板信息从缓存中取,若缓存中没有样式模板信息,则把样式模板信息存入到缓存中,需要模板信息时直接从缓存中取;

步骤9:通过模板样式文件进行转换,转换成标准S1000D节点后,根据当前光标位置节点的上下文约束关系,判断是否能插入转换后节点,若能够插入,则把根据样式模板转成的节点粘贴到对应位置,若不能插入,则进行提示信息说明,再往Transformer转换对象中设置必要参数,转换成S1000D标准DM的Xml文件。

2.根据权利要求1所述的WORD内容批量拷贝到基于S1000D标准DM的快速转换方法,其特征在于:所述步骤9中通过单例模式获取样式模板,往“Document”对象中设置必要参数的具体过程为:

当进行层级或者步骤节点转换时,将当前的DM类型设置到“Document”对象中,若当前DM类型是描述类型,html标签div class=section1转成S1000D标准一级层级段落标签levelledPara,html标签div class=section2转成S1000D标准子级层级段落标签levelledPara,用1,1.1,1.1.1来表示层级段落标签levelledPara样式,节点的父子或兄弟关系根据class属性值进行确定;若当前DM类型是程序类型,html标签div class=section1转成一级步骤节点标签procduralStep,div class=section2转成子级步骤节点标签levelledPara或者procduralStep,并且用1,1.1,1.1.1来表示层级样式,节点的父子或者兄弟关系根据class的属性值进行确定;

当进行标题节点转换时,若当前DM类型是描述类型,则转成title标签;若当前DM是程序类型,则将html标签h1~h6标签转成S1000D标准Xml的para标签;

当进行段落节点转换时,将html的P标签转成对应的S1000D标准Xml的para标签,根据节点上下文关系,在解析时,若当前节点的父节点是警告标签、注意标签和注标签时,则将html的P标签转换成S1000D标准Xml的warningAndCautionPara标签;

当进行有序/无序列表转换时,将html的有序标签olli转成S1000D标准Xml的sequentialListlistItem标签,用1,1.1,1.1.1来表示层级段落标签样式;将html的无序标签ulli S1000D标准Xml的randomListlistItem标签,用“.”表述无序样式;

当进行图标转换时,若源数据html中没有div class=figure标签,只出现imgalt=… src=xxx.png /img时,则默认转成S1000D标准Xml的图标标签symbol src= /;

当进行表格转换时,根据表格样式模板,把源数据表格节点及子节点与S1000D节点根据tr-----row、td-----entry、colgroup-----colspec、caption-----title对应关系进行转换;源数据表格跨列,则通过处理指令计算当前开始列与结束列,并且把对应结果作为单元格namest和nameend的属性值;

当进行文本操作时,若有处理指令.toxml-text.,则默认当作文本进行拷贝,若没有处理指令.toxml-text.,则作为para节点进行拷贝。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京国睿信维软件有限公司,未经南京国睿信维软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110316627.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top