[发明专利]票据信息区域自动识别和提取方法及设备在审
| 申请号: | 201310082322.0 | 申请日: | 2013-03-15 |
| 公开(公告)号: | CN103208004A | 公开(公告)日: | 2013-07-17 |
| 发明(设计)人: | 谭宜勇;张屹;吴玉峰;郑邦东 | 申请(专利权)人: | 北京英迈杰科技有限公司 |
| 主分类号: | G06K9/54 | 分类号: | G06K9/54 |
| 代理公司: | 北京骥驰知识产权代理有限公司 11422 | 代理人: | 朱智勇 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 票据 信息 区域 自动识别 提取 方法 设备 | ||
技术领域
本发明涉及计算机图像处理和信息识别领域,尤其是票据的信息区域的自动识别和提取技术。
背景技术
现代社会的各种商业活动,特别是银行业务,广泛使用各种票据。例如,随着现代社会的发展,人们越来越多地使用支票代替现金进行消费和结算。支票等票据的广泛使用必然导致票据的存储、管理以及票据信息的查找愈来愈麻烦。虽然目前在银行等有关行业广泛使用计算机来管理海量票据信息,但是向计算机系统人工输入票据信息需耗费大量的人力和时间。为此,有人提出了可以自动识别票据中的区域信息的票据自动识别技术,能够从票据中自动提取有用信息,并按照一定的分类规则保存到数据库中供用户检索查询,从而减少用户的工作量。
然而,目前的票据自动识别技术存在以下问题:首先,票据格式多种多样,没有统一的识别格式,目前没有快速有效的分类方式来识别票据的样式;其次,票据大多由人用笔填写,之后通过扫描等手段输入计算机识别系统,其中的污损、残缺、摆放不正等因素都会极大地影响系统的识别准确率;第三,目前针对票据的识别方式都是通过版面分类的方式进行预处理,这对于规规矩矩的扫描件是有效的,而对于票据形状、扫描坐标、旋转、倾斜度等处理效率都不高。
发明内容
为了克服现有技术存在的上述问题,本发明提供一种票据信息区域自动识别和提取技术,能够以良好的准确率和适应性自动地识别和提取多类票据中的感兴趣区域信息,从而节省票据处理的人力和时间。
根据本发明的一种票据信息区域自动识别和提取方法包括以下步骤:票据图像预处理,包括对票据图像进行去黑边、去噪点、纠偏以及灰度化处理;利用预先通过信息区域训练自学习而构建的信息区域特征数据库,对经过预处理的票据图像进行信息区域识别;边界和底纹处理,包括对所识别的信息区域进行重叠区域合并、去除底纹干扰、突出字符颜色以及二值化处理;字符区域增强处理,包括对经过边界和底纹处理的信息区域中的字符区域进行字符区域分割和膨胀腐蚀处理;以及提取经过字符区域增强处理的各个信息区域。
根据本发明的一种票据信息区域自动识别和提取设备包括:票据图像预处理装置,用于对票据图像进行去黑边、去噪点、纠偏以及灰度化处理;信息区域识别装置,用于利用预先通过信息区域训练自学习而构建的信息区域特征数据库,对经过票据图像预处理装置处理的票据图像进行信息区域识别;边界和底纹处理装置,用于对由信息区域识别装置识别的信息区域进行重叠区域合并、去除底纹干扰、突出字符颜色以及二值化处理;字符区域增强处理装置,用于对经过边界和底纹处理装置处理的信息区域中的字符区域进行字符区域分割和膨胀腐蚀处理;以及信息区域提取装置,用于提取经过字符区域增强处理装置处理的各个信息区域。
本发明通过票据图像预处理、边界和底纹处理,能够显著地减小票据摆放不正、票据污损或残缺等因素对票据自动识别的准确率的影响。本发明利用通过训练自学习而构建的信息区域特征数据库来进行票据信息区域识别,从而能够适应于多种票据格式,自动地识别和提取多类票据中的感兴趣区域信息。此外,本发明通过字符区域增强处理,能够显著地提高后续的光学字符识别(OCR)的准确率。
附图说明
图1是根据本发明的票据信息区域自动识别和提取方法的流程图;
图2例示根据本发明的票据图像预处理过程;
图3例示根据本发明的票据信息区域训练自学习过程;
图4例示根据本发明的票据信息区域识别过程;
图5例示根据本发明的边界和底纹处理过程;
图6例示根据本发明的字符区域增强处理过程;以及
图7是根据本发明的票据信息区域自动识别和提取设备的框图。
具体实施方式
如图1所示,根据本发明的票据信息区域自动识别和提取方法包括以下步骤:票据图像预处理、信息区域识别、边界和底纹处理、字符区域增强处理、以及信息区域提取。
如图2所示,票据图像预处理包括对例如从扫描仪等装置输入的票据图像进行去黑边、去噪点、纠偏以及灰度化处理。例如,可以通过边界连续黑值判断,去除票据图像中因为扫描出现的黑边;可以对整幅票据图像进行中值滤波,其中区域大小设为3*3,以有效地去除扫描产生的噪点;可以通过Hough变换来检测票据图像中的长线段,统计相应最大的两个垂直方向,然后根据标准的矩形方向进行旋转,以实现对票据图像的纠偏;最后对票据图像进行灰度化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京英迈杰科技有限公司,未经北京英迈杰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310082322.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:序批式苎麻分纤水洗机
- 下一篇:一种电催化还原对苯醌生产对苯二酚的方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





