[发明专利]字符切取方法、使用该方法的字符识别装置及程序有效
| 申请号: | 201280069152.6 | 申请日: | 2012-11-28 |
| 公开(公告)号: | CN104094283A | 公开(公告)日: | 2014-10-08 |
| 发明(设计)人: | 藤枝紫朗 | 申请(专利权)人: | 欧姆龙株式会社 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/20 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;黄纶伟 |
| 地址: | 日本国京*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 字符 方法 使用 识别 装置 程序 | ||
技术领域
本发明涉及基于图像处理的字符识别处理,尤其涉及用于从处理对象的图像中逐个字符地切取识别对象的字符的技术。
背景技术
在字符识别处理中,通常从拍摄字符串而生成的浓淡图像中切取各个字符,对切取出的每个字符实施使用了各种字符模型的匹配处理(模型匹配),从而识别字符串的内容。在字符的切取处理中,将处理对象的图像的2值化数据或者浓淡数据向x轴方向、y轴方向分别进行投影,从在各轴生成的投影图案中提取与字符对应的部位,由此确定与各个字符对应的区域(以下称为“字符区域”)。
作为有关字符识别处理的现有技术,在专利文献1中记载了这样的内容,将从通过投影处理而得到的浓度直方图中切取出的字符的宽度与阈值进行比较,在字符宽度大于阈值的情况下,视为有可能多个字符接触,并再次进行切取(参照第0024~0027段等。)。另外,还记载了这样的内容,在切取后的识别处理结果的可靠度较低的情况下、或核对对象的图像与表示字符的一部分的模型(汉字的偏旁的模型等)一致的情况下等,再次执行切取处理(参照第0037段等。)。
另外,在专利文献2中记载了这样的内容,在切取字符后进行暂时匹配处理而计算匹配可靠度,根据满足匹配可靠度为规定的基准值以上等条件的候选字符来决定全角字符的标准字符长度,以匹配可靠度低于固定值的区域为对象执行基于标准字符长度的半角字符切取处理(参照第0061段、第0078~第0085段等)。
现有技术文献
专利文献
专利文献1:日本公开专利公报1997-282417号公报
专利文献2:日本公开专利公报2010-44485号公报
发明内容
发明要解决的问题
在通常的字符切取处理中,采取将沿着投影方向的一条线段内的图像数据(2值或者多值)进行累计的方法。但是,由于印刷有识别对象的字符串的介质的样式和阴影等,背景部分的浓度的不均匀增大,导致背景部分的投影值与字符部分的投影值之差减小,进而切取的精度下降。
另外,在处理对象的字符串的字符之间的间距和字符宽度不一致、或相邻的字符之间的间隙微小时,即使是在投影图案中,也存在与字符对应的部位与与背景部分对应的部位的差异不明确而导致字符的切取失败的情况。
这样在切取字符的处理产生失败时,在以后的匹配处理中也产生错误识别,因而字符的识别精度下降。
关于上述问题,在专利文献1、2中披露了这样的技术思想:在切取字符后进行识别处理,以识别的精度较差的部位为对象再次进行切取,但是在这种方法中,处理复杂且花费时间,因而不适合于被要求处理的高速化的用途。
本发明的课题是着眼于上述问题,通过简单的处理高精度地切分字符串中的各个字符,并高速地进行稳定的切取处理。
用于解决问题的手段
为了解决上述问题,在基于本发明的字符切取方法中执行以下的第1步骤、第2步骤、第3步骤。
在第1步骤中,关于将沿着横穿处理对象的浓淡图像中的字符串的方法的线段中的最大浓度或者最小浓度投影到沿着字符串的轴上的投影处理,在浓淡图像中的字符比背景暗的情况下,选择最小浓度使投影对象位置沿着字符串移动并反复进行投影处理,在浓淡图像中的字符比背景亮的情况下,选择最大浓度使投影对象位置沿着字符串移动并反复进行投影处理。
在第2步骤中,从通过第1步骤而生成的投影图案中提取极大值和极小值,在极大值的变动范围和极小值的变动范围之间设定具有与这些值的变化对应的斜率的直线。在第3步骤中,当在第1步骤中对最大浓度进行了投影的情况下,将投影图案中的比直线高的浓度的投影范围作为切取对象范围,切取浓度图像中的切取对象范围的图像,当在第1步骤中对最小浓度进行了投影的情况下,将投影图案中的比直线低的浓度的投影范围作为切取对象范围,切取浓度图像中的切取对象范围的图像。
根据上述的方法,例如在将字符比背景暗的状态的图像作为处理对象的情况下,在第1步骤的投影处理中,将沿着横穿字符串的方向的线段中的最小浓度投影到沿着字符串的轴上。使投影对象位置沿顺着字符串的轴移动并反复执行该处理,由此生成与字符对应的部位成为谷底、与字符之间的间隙对应的部位成为山脊的投影图案。将在该投影图案的极小值(字符部分)的变动范围和极大值(字符之间的间隙部分)的变动范围之间设定的直线作为切取范围的特定的基准,由此能够根据部位变更切取用的基准值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于欧姆龙株式会社,未经欧姆龙株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280069152.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无线IC器件及无线通信终端
- 下一篇:用于产品性能和感知建模的系统和方法





