[发明专利]WORD内容批量拷贝到基于S1000D标准DM的快速转换方法有效

申请号：	202110316627.8	申请日：	2021-03-25
公开（公告）号：	CN112699641B	公开（公告）日：	2021-07-20
发明（设计）人：	孙国防;蒋巍;孙浩	申请（专利权）人：	南京国睿信维软件有限公司
主分类号：	G06F40/151	分类号：	G06F40/151;G06F40/186
代理公司：	南京苏创专利代理事务所(普通合伙) 32273	代理人：	凤婷
地址：	210013 江苏省南***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	word 内容批量拷贝基于 s1000d 标准 dm 快速转换方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.WORD内容批量拷贝到基于S1000D标准DM的快速转换方法，其特征在于：包括如下步骤：

步骤1：文档html化：对文档全文进行html标签语言的文本化，通过键盘“CTRL+C/CTRL+V”触发复制/粘贴命令，将文档内容复制到剪切板中，设置文档数据格式为html格式，通过Transformer转换对象获取剪切板中html格式内容，输出html标签语言文本；

步骤2：根据步骤1中底层html数据的“xmlns:w=urn:schemas-microsoft-com:office:WORD”标签语言文本判断是否来源于word文档，若是，则进入步骤3，若不是，则调用普通转换操作；

步骤3：核对html标签语言文本是否为已注册的word粘贴命令，若否，则把word粘贴命令注册到缓存的命令集合中，然后进入步骤4，若是，则直接进入步骤4；

步骤4：判断当前光标是否定位在编辑区节点中，若否，则警告提示，若是，则进入步骤5；

步骤5：获取word需要粘贴的对象，执行粘贴命令，并且初始化xslt样式模板；

步骤6：启动多线程操作，对粘贴后的html标签语言文本进行裁剪、调整或者删除不必要的内容，为转换S1000D节点做准备，多线程操作的具体执行过程为：

步骤6.1：把html标签语言文本中字符串转成Document对象进行解析，并删除html标签语言文本中的命名空间及注释内容，再把图片内容下载到本地临时文件夹，普通图片用png格式保存，VISIO格式用EMF压缩格式保存，文件命名格式为“image”+编号；

步骤6.2：删除html标签语言文本中底层对应的meta多余标签内容，删除全局字体相关的样式；

步骤6.3：删除原word纯文本内容样式、有序列表、无序列表样式及文本布局格式，修改语言为“zh-CN”格式；

步骤6.4：删除底层原word文档全文中的链接样式；

步骤6.5：根据原word文档底层表格列宽，修改为用百分比表示列宽，增加处理指令，用来预处理按照S1000D标准标签表示的表格；

步骤6.6：修改图片标签，把原word文档中的底层img标签改为figure，并且增加属性“class='figcaption'”来表示图片，若没有加入此属性的，则默认作为图标；

步骤6.7：根据原word文档中的底层p标签的属性“class='MsoNormal'”判断底层p标签是有序列表还是无序列表，若是有序列表，则把p标签转成对应的有序“olli”标签，若是无序列表，则把p标签转成对应的无序“ulli”标签；

步骤6.8：处理图注或者表注，根据原word文档中的图片或者表格标签中的“class='figcaption'”或者“class='caption'”来填充图片或者表格的标题；

步骤6.9：预处理标题标签，根据原word文档全文中的底层标签，一级标题标签“h1/h1”转成对应的“div class='section1'h1h1/div”标签，在后期根据“class='section1'”转成对应的S1000D节点或者步骤标签；

步骤6.10：删除原word文档中的底层空文本标签、span标签及样式，把“b、big、cite、em、i、small、strong和u”标签中的内容替换到外层p标签中，并且删除“b、big、cite、em、i、small、strong和u”标签及其样式；

步骤6.11：根据步骤6.1-6.10，生成对应的标签内容，作为转成S1000D标签的输入原Xml内容；

步骤6.12：将步骤6.11生成的输入原Xml内容解析转成“Document”对象，为转成标准S1000D内容做准备；

步骤7：若当前线程能在1秒内处理完源数据，则不弹出日志对话框，若超过1秒还没有执行完，则通过thread.join(1000)结束当前线程，弹出操作日志对话框；

步骤8：根据xslt样式文件路径获取样式模板，若缓存中有样式模板信息，则默认样式模板信息从缓存中取，若缓存中没有样式模板信息，则把样式模板信息存入到缓存中，需要模板信息时直接从缓存中取；

步骤9：通过模板样式文件进行转换，转换成标准S1000D节点后，根据当前光标位置节点的上下文约束关系，判断是否能插入转换后节点，若能够插入，则把根据样式模板转成的节点粘贴到对应位置，若不能插入，则进行提示信息说明，再往Transformer转换对象中设置必要参数，转换成S1000D标准DM的Xml文件。

2.根据权利要求1所述的WORD内容批量拷贝到基于S1000D标准DM的快速转换方法，其特征在于：所述步骤9中通过单例模式获取样式模板，往“Document”对象中设置必要参数的具体过程为：

当进行层级或者步骤节点转换时，将当前的DM类型设置到“Document”对象中，若当前DM类型是描述类型，html标签div class=section1转成S1000D标准一级层级段落标签levelledPara，html标签div class=section2转成S1000D标准子级层级段落标签levelledPara，用1，1.1，1.1.1来表示层级段落标签levelledPara样式，节点的父子或兄弟关系根据class属性值进行确定；若当前DM类型是程序类型，html标签div class=section1转成一级步骤节点标签procduralStep，div class=section2转成子级步骤节点标签levelledPara或者procduralStep，并且用1，1.1，1.1.1来表示层级样式，节点的父子或者兄弟关系根据class的属性值进行确定；

当进行标题节点转换时，若当前DM类型是描述类型，则转成title标签；若当前DM是程序类型，则将html标签h1~h6标签转成S1000D标准Xml的para标签；

当进行段落节点转换时，将html的P标签转成对应的S1000D标准Xml的para标签，根据节点上下文关系，在解析时，若当前节点的父节点是警告标签、注意标签和注标签时，则将html的P标签转换成S1000D标准Xml的warningAndCautionPara标签；

当进行有序/无序列表转换时，将html的有序标签olli转成S1000D标准Xml的sequentialListlistItem标签，用1，1.1，1.1.1来表示层级段落标签样式；将html的无序标签ulli S1000D标准Xml的randomListlistItem标签，用“.”表述无序样式；

当进行图标转换时，若源数据html中没有div class=figure标签，只出现imgalt=… src=xxx.png /img时，则默认转成S1000D标准Xml的图标标签symbol src= /；

当进行表格转换时，根据表格样式模板，把源数据表格节点及子节点与S1000D节点根据tr-----row、td-----entry、colgroup-----colspec、caption-----title对应关系进行转换；源数据表格跨列，则通过处理指令计算当前开始列与结束列，并且把对应结果作为单元格namest和nameend的属性值；

当进行文本操作时，若有处理指令.toxml-text.，则默认当作文本进行拷贝，若没有处理指令.toxml-text.，则作为para节点进行拷贝。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京国睿信维软件有限公司，未经南京国睿信维软件有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110316627.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种用于加载试验的液压系统和控制方法
下一篇：一种基于BIM的漏水警报的定位方法、装置及设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]WORD内容批量拷贝到基于S1000D标准DM的快速转换方法有效

专利文献下载