[发明专利]文档图像的字符真值获取装置及方法、电子设备有效
| 申请号: | 201610535045.8 | 申请日: | 2016-07-08 |
| 公开(公告)号: | CN107590155B | 公开(公告)日: | 2020-09-08 |
| 发明(设计)人: | 范伟 | 申请(专利权)人: | 富士通株式会社 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/20 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 陶海萍;王锴 |
| 地址: | 日本神奈*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 图像 字符 真值 获取 装置 方法 电子设备 | ||
本发明实施例提供一种文档图像的字符真值获取装置及方法、电子设备,通过使用局部匹配的匹配方式,根据匹配误差和偏移量更新已标记图像块和活跃区域,并根据活跃区域中的特征更新变换矩阵,能够获取各种文档图像的字符真值,适用范围广且获取的真值准确度较高。
技术领域
本发明涉及通信技术领域,尤其涉及一种文档图像的字符真值获取装置及方法、电子设备。
背景技术
随着数码相机和移动设备等电子设备的普及,基于数码相机或移动设备拍摄的文档识别与分析受到越来越多的关注。由于数码相机和移动设备的易用性和便携性,使得用户能够随时拍摄文档图像。但是,用户拍摄的文档图像的质量与传统的文档扫描图像相比,受到更多不确定性因素的影响。例如,用户拍摄的文档可能存在卷曲,弯折等变形以及模糊等情况。
尽管针对扫描文档的光学字符识别(Optical Character Recognition,OCR)技术已经比较成熟,但是,如果将其简单的应用于相机拍摄文档图像的识别,其效果并不理想。为了训练更有针对性的拍摄文档字符识别分类器,非常有必要收集大量带标注信息的样本图像。然后,传统的基于人工标注的方式不仅效率低下,容易出错,而且会带来极大的人力成本。
现有的自动字符真值标注方法,利用文档图像检索技术,将拍摄的文档图像与数据库中的对应标准电子文档相关联,并利用标准电子文档中自带的真值信息对拍摄的文档图像中的字符进行标注,即获取拍摄的文档图像中的字符真值。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
但是,现有的字符真值获取方法基于全局文档图像匹配,其只适用于平整且清晰的文档的检索。而在实际应用中,用户拍摄的文档可能存在卷曲,弯折等变形以及模糊等缺陷,图1是拍摄的文档图像中的文档存在卷曲、弯折和模糊的示意图。在这些情况下,利用该现有方法无法获得所有字符的真值,且获取的真值准确度较低。
本发明实施例提供一种文档图像的字符真值获取装置及方法,通过使用局部匹配的匹配方式,根据匹配误差和偏移量更新已标记图像块和活跃区域,并根据活跃区域中的特征更新变换矩阵,能够获取各种文档图像的字符真值,适用范围广且获取的真值准确度较高。
根据本发明实施例的第一方面,提供一种摄影图像的字符真值获取装置,所述装置包括:变换单元,其用于根据所述摄影图像与标准图像之间的当前变换矩阵,对所述摄影图像进行变换;匹配单元,其用于将变换后的文档图像中的图像块与所述标准图像中的图像块进行局部匹配,获得变换后的文档图像中与所述标准图像中的所述图像块匹配的匹配图像块,从而获得与所述匹配图像块对应的所述摄影图像中的相应图像块;计算单元,其用于计算所述摄影图像中的所述相应图像块与所述标准图像中的所述图像块的匹配误差以及偏移量;第一更新单元,其用于根据所述匹配误差更新所述文档图像中的已标记图像块;确定单元,其用于根据所述匹配误差和所述偏移量,确定所述已标记图像块中的活跃区域;第二更新单元,其用于根据所述活跃区域中的特征,更新所述当前变换矩阵;判断单元,其用于判断更新前后的已标记图像块是否发生变化;以及输出单元,其用于当更新前后的已标记图像块发生变化时,将更新后的变换矩阵作为所述当前变换矩阵以用于对所述文档图像进行变换;当更新前后的已标记图像块没有变化时,输出更新后的已标记图像块中的字符真值。
根据本发明实施例的第二方面,提供一种电子设备,包括:根据本发明实施例的第一方面所述的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610535045.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种天然气开采设备用钻头清洗设备
- 下一篇:一种热弯机成型模具的清理装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





