[发明专利]一种PDF文档到DWG文档转换的方法无效
申请号: | 201110305839.2 | 申请日: | 2011-09-27 |
公开(公告)号: | CN102368234A | 公开(公告)日: | 2012-03-07 |
发明(设计)人: | 肖徊 | 申请(专利权)人: | 邵阳神风动力制造有限责任公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 422001 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 pdf 文档 dwg 转换 方法 | ||
技术领域
本发明是一种信息转换方法,属于信息技术类,确切地说,它包括规则生成模块、自动抽取模块的信息抽取系统的方法。
背景技术
随着web技术的发展,越来越多的信息呈现在用户面前。如何对海量的信息资源进行处理,是电子文档管理工作的一项重要内容。为了实现对网络资源的有效开发利用,需要进行信息的分类、检索等操作。所有对信息处理的操作都应该涉及到对文档信息的抽取。文档信息抽取是指从文档中抽取指定的一类信息,并将其形成可编辑化的文档。
发明内容
本发明的目的在于发明一种信息转换方法。
本发明是这样实现的:所述方法包含以下步骤:
步骤一:利用规则生成模块,针对PDF源文档的内容,用户可根据实际情况进行相应的设置;通过文档解析器(print2cad)读取PDF源文档的内容,并将其转换为规则的DWG文档;
步骤二:利用自动抽取模块接受规则的DWG文档,得到满足目标并且具有编辑功能的DWG文档。
本发明可以对转换后的DWG文件做进一步的操作,从而提高文档自动分类和用户编辑图纸的效率。
附图说明
图1为本发明的系统总体框架图:
图2为本发明的系统流程图:
图3为样例PDF文档片段;
图4为样例目标DWG文档;
图中:1为PDF源文档;2为规则生成模块;3规则的DWG文档;4为自动抽取模块;5为目标并且具有编辑功能的DWG文档;6为文档解析器;7为PDF文档库。
以下将结合实施例对本发明进行进一步的描述:
具体实施方式
一、模块的具体设计和实现
1、规则生成模块:
规则生成模块2设计是针对PDF源文档1的内容,用户可根据实际情况进行相应的设置;通过文档解析器(print2cad)6读取PDF源文档的内容,并将其转换为规则的DWG文档3。
本模块的实现有两个关键点:
(一)规则的DWG文档的结构的定义。
对规则的DWG文档结构设计的要求如下:一是它能够描述源文档的格式特征和图形信息,这是自动抽取模块4规则匹配的依据;二是PDF文档到规则的DWG文档的转换最好能够较为容易地进行。
(二)使用PDF文档的解析器(print2cad),生成满足上述要求的目标并且具有编辑功能的DWG文档。
PDF文档解析器(print2cad)6能够将PDF文档转换为规则DWG文档。它们转换后生成的DWG文档基本上都是具有编辑功能的DWG文文件,其中生成的规则的DWG文件中包含了PDF源文档1中大量的图形信息。
2、自动抽取模块:
自动抽取模块4需要做的工作是执行抽取规则DWG文档3。本系统使用Acme CAD Conyerter作为DWG文档执行引擎,由于执行引擎完全支持DWG转换接口,所以它们可以任意替代而不影响应用程序代码。
二、信息抽取系统运行过程
步骤一:针对PDF源文档1的内容,用户可根据实际情况进行相应的设置;通过文档解析器(print2cad)6读取PDF源文档的内容,并将其转换为规则的DWG文档3。规则的DWG文档3是自动抽取模块4输入项。
步骤二:接受规则的DWG文档3,得到满足目标并且具有编辑功能的DWG文档5,如图4。
三、系统的特点
1、规则生成模块2选择DWG格式作为规则DWG文档的信息表现形式,优点表现在以下两个方面:
(一)可以通过DWG文档可以保存PDF源文档1中大量的图形信息,从而可以利用PDF文档中的显示信息有效地完成基于规则的信息抽取。
(二)可以利用Acme CAD Converter的标准化工具完成对规则DWG文档的合法性检验和有效性验证,以及利用Acme CAD Conyerter对规则的DWG文档进行解析,而不需要开发专门工具。
2、在规则生成模块中,选择DWG文件作为抽取规则描述语言。
DWG文档是二进制格式,可以通过文档解析器(print2cad)转为规则的DWG文档,这样可以很方便的实现数据的读写,同时支持它的工具很多,目前已经获得了包括Acme CAD Conyerter等在内的二十多种工具的支持;Acme CAD Conyerter可以浏览不同版本的DWG文件,支持shx字体文件,xref块文件,和光栅文件的导入,支持创建对dwg和dxf文件的关联。完美的支持CAD图形中文字体的显示,易于编辑和修改,而且具有良好的扩展性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邵阳神风动力制造有限责任公司,未经邵阳神风动力制造有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110305839.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种热处理炉的密封门
- 下一篇:屏蔽式电平移位晶体管