[发明专利]横向校对和输出双层PDF的方法和装置有效

专利信息
申请号: 201310558843.9 申请日: 2013-11-12
公开(公告)号: CN103714047B 公开(公告)日: 2017-10-10
发明(设计)人: 段雅东;陈永生;高志强 申请(专利权)人: 北京中献电子技术开发中心
主分类号: G06F17/25 分类号: G06F17/25
代理公司: 北京康信知识产权代理有限责任公司11240 代理人: 吴贵明,张永明
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 横向 校对 输出 双层 pdf 方法 装置
【权利要求书】:

1.一种横向校对和输出双层PDF的方法,包括以下步骤:

步骤1:从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置;

步骤2:修改字符和字符图像位置;

步骤3:根据字符图像位置和大小输出双层PDF文件;

其中,

所述步骤1的导入行图像和字符图像的位置,包括以下步骤:

步骤1.1:根据每个字符在图像中的位置,分析出行图像,计算出行图像的位置;

步骤1.2:根据每个字符在图像中的位置和所在行图像的位置,使用行图像的上下边界和字符图像左右边界形成的矩形框得到字符图像的位置;

所述步骤2的修改字符和字符图像位置,包括以下步骤:

步骤2.1:浏览字符图像和字符文字,查找错误字符和位置错误的文字图像;

步骤2.2:对识别成多个字符结果的字符图像进行合并处理;对识别成单个字符结果的多个字符图像进行拆分处理;修改错误的文字;调整字符图像的位置和大小,

其中,所述步骤2.1中,有以下几种显示方式:

方式3.1:以图像为背景,文字行显示在图像行的上方或下方;

方式3.2:以图像为背景,文字行和图像行完全重合;

方式3.3:文字行和图像行交错显示;

根据字符图像位置和大小输出双层PDF文件,包括:首先向PDF文件输出图像层;然后根据校对后字符图像位置,得到文本层的输出位置,根据字符图像外接矩形宽度得到文字大小,依据输出位置和文字大小,输出文本层,得到双层PDF文件。

2.根据权利要求1所述的方法,所述步骤2.1中,文字行和图像行有以下几种对齐方式:

方式4.1:文字行中每个字符相对于图像行中的字符图像居中对齐;

方式4.2:文字行整行相对于图像行居中对齐。

3.根据权利要求1所述的方法,所述步骤2.2的合并处理是:合并所述多个字符结果的外接矩形,得到正确的字符图像。

4.根据权利要求1所述的方法,所述步骤2.2的拆分处理是:将选中的字符图像外接矩形分成左右两个字符图像。

5.根据权利要求1所述的方法,所述步骤2.2的调整字符图像的位置和大小是:调整字符图像的外接矩形的大小和位置,选中字符图像,调整外接矩形框的宽度、高度或者位置。

6.根据权利要求1所述的方法,所述步骤3中,输出双层PDF文件时根据行图像高度计算字体大小,根据文字图像中心位置计算输出文字的中心位置。

7.一种横向校对和输出双层PDF的装置,包括以下模块:

输入模块,从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置;其中,导入行图像和字符图像的位置包括:根据每个字符在图像中的位置,分析出行图像,计算出行图像的位置;根据每个字符在图像中的位置和所在行图像的位置,使用行图像的上下边界和字符图像左右边界形成的矩形框得到字符图像的位置;

校对模块,修改字符和字符图像位置;其中,修改字符和字符图像位置包括:浏览字符图像和字符文字,查找错误字符和位置错误的文字图像;对识别成多个字符结果的字符图像进行合并处理;对识别成单个字符结果的多个字符图像进行拆分处理;修改错误的文字;调整字符图像的位置和大小;其中,浏览字符图像和字符文字,查找错误字符和位置错误的文字图像的显示方式包括以下几种:方式3.1:以图像为背景,文字行显示在图像行的上方或下方;方式3.2:以图像为背景,文字行和图像行完全重合;方式3.3:文字行和图像行交错显示;

输出模块,根据字符图像位置和大小输出双层PDF文件,其中,根据字符图像位置和大小输出双层PDF文件,包括:首先向PDF文件输出图像层;然后根据校对后字符图像位置,得到文本层的输出位置,根据字符图像外接矩形宽度得到文字大小,依据输出位置和文字大小,输出文本层,得到双层PDF文件。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中献电子技术开发中心,未经北京中献电子技术开发中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310558843.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top