[发明专利]一种PDF文档到DWG文档转换的方法无效

专利信息
申请号: 201110305839.2 申请日: 2011-09-27
公开(公告)号: CN102368234A 公开(公告)日: 2012-03-07
发明(设计)人: 肖徊 申请(专利权)人: 邵阳神风动力制造有限责任公司
主分类号: G06F17/22 分类号: G06F17/22
代理公司: 暂无信息 代理人: 暂无信息
地址: 422001 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 pdf 文档 dwg 转换 方法
【说明书】:

技术领域

发明是一种信息转换方法,属于信息技术类,确切地说,它包括规则生成模块、自动抽取模块的信息抽取系统的方法。 

背景技术

随着web技术的发展,越来越多的信息呈现在用户面前。如何对海量的信息资源进行处理,是电子文档管理工作的一项重要内容。为了实现对网络资源的有效开发利用,需要进行信息的分类、检索等操作。所有对信息处理的操作都应该涉及到对文档信息的抽取。文档信息抽取是指从文档中抽取指定的一类信息,并将其形成可编辑化的文档。 

发明内容

本发明的目的在于发明一种信息转换方法。 

本发明是这样实现的:所述方法包含以下步骤: 

步骤一:利用规则生成模块,针对PDF源文档的内容,用户可根据实际情况进行相应的设置;通过文档解析器(print2cad)读取PDF源文档的内容,并将其转换为规则的DWG文档; 

步骤二:利用自动抽取模块接受规则的DWG文档,得到满足目标并且具有编辑功能的DWG文档。 

本发明可以对转换后的DWG文件做进一步的操作,从而提高文档自动分类和用户编辑图纸的效率。 

附图说明

图1为本发明的系统总体框架图: 

图2为本发明的系统流程图: 

图3为样例PDF文档片段; 

图4为样例目标DWG文档; 

图中:1为PDF源文档;2为规则生成模块;3规则的DWG文档;4为自动抽取模块;5为目标并且具有编辑功能的DWG文档;6为文档解析器;7为PDF文档库。 

以下将结合实施例对本发明进行进一步的描述: 

具体实施方式

一、模块的具体设计和实现 

1、规则生成模块: 

规则生成模块2设计是针对PDF源文档1的内容,用户可根据实际情况进行相应的设置;通过文档解析器(print2cad)6读取PDF源文档的内容,并将其转换为规则的DWG文档3。 

本模块的实现有两个关键点: 

(一)规则的DWG文档的结构的定义。 

对规则的DWG文档结构设计的要求如下:一是它能够描述源文档的格式特征和图形信息,这是自动抽取模块4规则匹配的依据;二是PDF文档到规则的DWG文档的转换最好能够较为容易地进行。 

(二)使用PDF文档的解析器(print2cad),生成满足上述要求的目标并且具有编辑功能的DWG文档。 

PDF文档解析器(print2cad)6能够将PDF文档转换为规则DWG文档。它们转换后生成的DWG文档基本上都是具有编辑功能的DWG文文件,其中生成的规则的DWG文件中包含了PDF源文档1中大量的图形信息。 

2、自动抽取模块: 

自动抽取模块4需要做的工作是执行抽取规则DWG文档3。本系统使用Acme CAD Conyerter作为DWG文档执行引擎,由于执行引擎完全支持DWG转换接口,所以它们可以任意替代而不影响应用程序代码。 

二、信息抽取系统运行过程 

步骤一:针对PDF源文档1的内容,用户可根据实际情况进行相应的设置;通过文档解析器(print2cad)6读取PDF源文档的内容,并将其转换为规则的DWG文档3。规则的DWG文档3是自动抽取模块4输入项。 

步骤二:接受规则的DWG文档3,得到满足目标并且具有编辑功能的DWG文档5,如图4。 

三、系统的特点 

1、规则生成模块2选择DWG格式作为规则DWG文档的信息表现形式,优点表现在以下两个方面: 

(一)可以通过DWG文档可以保存PDF源文档1中大量的图形信息,从而可以利用PDF文档中的显示信息有效地完成基于规则的信息抽取。 

(二)可以利用Acme CAD Converter的标准化工具完成对规则DWG文档的合法性检验和有效性验证,以及利用Acme CAD Conyerter对规则的DWG文档进行解析,而不需要开发专门工具。 

2、在规则生成模块中,选择DWG文件作为抽取规则描述语言。 

DWG文档是二进制格式,可以通过文档解析器(print2cad)转为规则的DWG文档,这样可以很方便的实现数据的读写,同时支持它的工具很多,目前已经获得了包括Acme CAD Conyerter等在内的二十多种工具的支持;Acme CAD Conyerter可以浏览不同版本的DWG文件,支持shx字体文件,xref块文件,和光栅文件的导入,支持创建对dwg和dxf文件的关联。完美的支持CAD图形中文字体的显示,易于编辑和修改,而且具有良好的扩展性。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于邵阳神风动力制造有限责任公司,未经邵阳神风动力制造有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110305839.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top