[发明专利]文档图像处理装置及方法在审
申请号: | 201710964248.3 | 申请日: | 2017-10-17 |
公开(公告)号: | CN109671157A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 郭瑞山;乔智勇 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06T19/00 | 分类号: | G06T19/00 |
代理公司: | 北京怡丰知识产权代理有限公司 11293 | 代理人: | 迟军;李艳丽 |
地址: | 日本东京都*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档图像 文档模型 存储 文档图像处理 信息确定 纸质文档 标记检测单元 信息变换单元 信息获取单元 标记更新 标记确定 信息转换 坐标变换 更新 文档 捕捉 携带 检测 | ||
本发明公开了文档图像处理装置及方法。所述装置包括:信息获取单元,获取与携带标记的纸质文档对应的存储的文档模型以及从纸质文档捕捉的文档图像的信息,其中所述标记包括第一标记和第二标记;第一标记检测单元,检测所述文档图像中的第一标记并且获得第一标记的姿态;第二标记确定单元,根据变换和所述存储的文档模型的所述信息确定所述文档图像中的第二标记,其中所述变换根据第一标记的所述姿态和所述存储的文档模型的所述信息确定;及信息变换单元,根据更新的变换将所述存储的文档模型的所述信息转换到所述文档图像,其中,所述更新的变换基于所述变换和第二标记更新。与现有技术相比,本发明将提高从文档到文档图像的坐标变换的准确性。
技术领域
本发明涉及计算机视觉系统,更具体地,本发明涉及文档图像处理方法及装置,所述文档图像处理方法及装置将文档的坐标转换到对应的文档图像。
背景技术
随着增强现实(AR)技术的发展,虚拟信息与实物或捕捉的实物图像叠加显示相应地尤为重要。近几年来,该技术被广泛应用于许多情境,例如面对面的商务会议,在这些情境中,需要确定文档姿态(例如,位置和方向)并进一步显示文档周围的一些相关内容。但在真实环境中,因为例如亮度变化、纸张变形等各种因素的一些影响,所以难以稳定、精确地确定文档姿态。
近几年来,利用标记,进行基于AR技术的跟踪可得到文档姿态。美国专利US8233200B2公开了一种示例性的用于对象姿态识别的基于AR标记的跟踪技术,该技术包括:将已知表格的模型图像划分为通过至少三个对齐标记限定的区段,并且通过将捕捉的图像上对齐标记的位置与模型图像上对齐标记的位置进行比较,为每一个区段生成一个转换函数,然后将所述转换函数应用到区段内的其他标记来计算标记的正确位置。美国专利US7317557B2公开了另一种示例性的用于对象姿态识别的基于AR标记的跟踪技术,该技术提供了一种使用标记将文档图像的坐标转换为打印文档的坐标的方法。
在相机从纸质文档或打印文档捕捉文档图像的情况下,有时纸质文档弯曲(bent)、卷曲(rolled)或折叠(folded),因此所捕捉的文档图像可能会变形。并且由于变形,因此无法准确进行坐标变换。为了减小偏差,通用方法是在纸质文档上靠近目标位置或给定位置处添加标记。但是,由于标记必须足够大以被检测到以及与其他文档内容区分开,因此对于现有的纸质文档,没有足够的空间放置标记。
此外,通过通用的AR标记,高精度地跟踪狭长对象或边缘空间狭长的对象非常具有挑战性。例如,纸质文档的边缘区域的空间比较狭窄,但是标记形状为正方形,则在增加标记的ID数量的情况下,标记的尺寸将在两个方向上增加。因此,该方法不适合纸质文档或狭长的对象,仍需找到一种新的方法来高精度地识别对象的姿态。
发明内容
因此,鉴于上面的背景技术中的记载,本发明旨在解决上述问题。
根据本发明的一个方面,提供一种文档图像处理装置,所述装置包括:信息获取单元,被构造为获取与携带标记的纸质文档对应的存储的文档模型以及从纸质文档捕捉的文档图像的信息,其中所述标记包括第一标记和第二标记;第一标记检测单元,被构造为检测所述文档图像中的第一标记并获得所述第一标记的姿态;第二标记确定单元,被构造为根据变换和所述存储的文档模型的所述信息确定所述文档图像中的第二标记,其中所述变换根据所述第一标记的所述姿态和所述存储的文档模型的所述信息确定;及信息变换单元,被构造为根据更新的变换将所述存储的文档模型的所述信息转换到所述文档图像,其中,所述更新的变换基于所述变换和所述第二标记更新。
利用本发明,从文档到文档图像的坐标变换的准确性将得到提高。
根据以下参照附图的描述,本发明的其他特性特征和优点将显而易见。
附图说明
并入本说明书中并构成本说明书一部分的附图以图示方式说明本发明的实施例,并且与文字描述一起用来解释本发明的原理。
图1例示带有标记的纸质文档的示例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710964248.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:三维模型加载方法和装置
- 下一篇:一种游戏画面的优化方法