[发明专利]从图像估计消失点的方法和装置、计算机程序及其存储介质有效

专利信息
申请号: 200610163163.7 申请日: 2006-11-29
公开(公告)号: CN101192269A 公开(公告)日: 2008-06-04
发明(设计)人: 曾旭;胥立丰;肖其林 申请(专利权)人: 佳能株式会社
主分类号: G06K9/03 分类号: G06K9/03
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 康建峰
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 估计 消失 方法 装置 计算机 程序 及其 存储 介质
【说明书】:

技术领域

发明一般地涉及用于自动透视校正的方法。更具体地说,本发明涉及用于从图像(例如,文档图像)估计消失点的方法和装置、计算机程序及其存储介质。

背景技术

文档扫描广泛地用于捕获文本及将其转换成电子形式以便进一步的处理。随着近年来照相机分辨率的提高,通过数字照相机捕获文本变为一种替代的选择。数字照相机便携并且提供正面、非接触、近乎即时的图像获取,但是由于在宽范围的使用条件下操作而受到图像质量问题的困扰。最严重的问题之一是照相机以任意透视拍摄文档并且给所捕获的图像带来透视失真。透视的存在使读者困惑并且使比如光学字符识别(OCR)、布局分析和压缩的图像分析操作缓慢并且不可靠。

因此,需要自动纠正透视失真的图像以产生文本区域的正视图(upright view)。

尽管几何校正已相当地成熟,比如由R.M.Haralick在“Monocular vision using inverse perspective projection geometry:analytic relations(使用逆透视投影几何的单眼视觉:解析关系),Proceedings of the IEEE Computer Vision and Pattern RecognitionConference 1989;370-378”中提出的方法,但是在该文献中未提及针对通过数字照相机捕获的透视失真文档图像的校正技术。在由P.Clark和M.Mirmehdi公开的“Recognizing text in real scenes(真实场景中识别文本),International Journal of Document Analysis and Recognition4(4)(2002)243-257”中,利用由背景和文本所在平面之间的边界形成的四边形取得透视失真文本的正视图。在使用感知分组方法提取四边形之后,执行双线性插值操作构造修正的文档图像。由于该算法严重依赖四边形的提取,所以所捕获的文档图像中存在高对比度文档边界(HDB)是正确校正的必要条件。

取代使用在真实场景中不是总存在的文档边界,M.Pilu基于虚线索的提取在“Extraction of illusory linear clues in perspectivelyskewed documents(在透视地倾斜文档中提取虚线性线索),Proceedings of the IEEE Computer Vision and Pattern RecognitionConference 2001;363-368”中提出一种新的校正方法。为了提取水平线索,首先将字符或字符组变换为模糊点并且为相邻的模糊点对计算成对突出尺寸,其指示它们属于一条文本线的可能性。其后,基于知觉组织原则的网络横跨该文本,并且计算水平线索作为模糊点的突出线性组。尽管在水平线索的提取方面做得很好,但该方法不能提取足够的垂直信息。

在由C.R.Dance提出的“Perspective estimation for documentimages(文档图像的透视估计),Proceeding of the SPIE Conference onDocument Recognition and Retrieval IX 2002;244-254”中,使用基于从文本线提取的平行线和垂直段落空白(VPM)估计的两个主要消失点矫正失真的文档图像。此方法的主要缺点是它仅工作于完全对齐的文本,因为它严重依赖于VPM特征的存在。另外,也未阐明提取平行线的方法。

在由P.Clark和M.Mirmehdi公开的“Rectifying perspectiveviews of text in 3D scenes using vanishing points(使用消失点在3D场景中校正文本的透视图),Pattern Recognition 36(2003)2673-2686”中,根据一些段落格式(PF)信息估计两个消失点。更具体地,根据新颖的2D投影柱状图的扩展计算水平消失点,并且当段落未充分对齐时根据一些PF信息比如VPM或文本线间隔变化计算垂直消失点。然而,为实现这种校正方法,需要很好格式化过的段落。

如今,可以校正透视失真文档图像的若干应用已经进入市场,例如,Casio EX-Z55和Wintone Huishi。然而,它们都依赖于HDB提取,并且由于缺少足够的边界信息,结果不可靠。

发明内容

鉴于上述情况,完成本发明并且其目的是自动地纠正透视失真图像以产生文本区域的正视图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200610163163.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top