[发明专利]基于影像档案电子资料识别系统中分类器的识别方法有效
| 申请号: | 201410262741.7 | 申请日: | 2014-06-13 |
| 公开(公告)号: | CN103996055B | 公开(公告)日: | 2017-06-09 |
| 发明(设计)人: | 林珉 | 申请(专利权)人: | 上海珉智信息科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 上海信好专利代理事务所(普通合伙)31249 | 代理人: | 张静洁,包姝晴 |
| 地址: | 201204 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 影像 档案 电子 资料 识别 系统 分类 方法 | ||
技术领域
本发明涉及数据管理系统领域,特别涉及一种基于影像档案电子资料识别系统中分类器的识别方法。
背景技术
现代社会中,纸质文档(例如银行票据凭证、个人信息表等等)仍然被广泛使用,对纸质文档的存储、管理及文件上的信息归类、查找都十分困难。计算机和智能手机的普及,使得通过电子方法对纸质文档进行管理成为可能,但是将纸质文档上的信息通过人工输入电子系统需要耗费大量的时间和人力;而通过智能系统自动识别票据内容还存在很多局限。
诸如银行业务中,票据上的大量信息都是打印上去的印刷体的数字及中英文字符,准确提取并识别这些信息对票据自动处理有着重要作用。然而,由于票据版面的复杂性和识别要求的特殊性,在实际系统中可能会遇到各种困难:票据版面上存在印章、油墨、手写信息、背景图案等等干扰信息;另外票据上还会出现字符粘连、字体字号变化频繁、识别信息不全等问题。针对于银行系统中的兑付业务而言,其过程是将每个柜员办理的业务票据与电脑中存储的流水信息进行比对,以检查操作员是否进行了误操作;如果票据内容识别错误会导致账目不平的后果。
近些年来,相对于设计更复杂的分类器来提高识别率来说,人们更倾向于将一些单个的分类器融合起来以获得更高的性能。多分类器融合算法包括两个基本途径:多个分类器的融合,也就是将每个分类器的输出结果按照特定的融合规则进行融合来得到最终的分类结果;动态分类器选择,也就是对于特定类型的待识别模式动态选择最有可能分类正确的分类器进行分类。目前在自动识别系统中,多分类器融合方法得到了很好地应用。
发明内容
为了解决上述现有问题,本发明提供了一种基于影像档案电子资料识别系统中分类器的识别方法,对识别结果进行分类后按相应的格式模板进行识别,有效提高识别效率和准确性。
为了达到上述目的,本发明的技术方案是提供一种基于影像档案电子资料识别系统中分类器的识别方法,在识别系统中设置分类器,对图像的识别信息进行分类得到不同的信息项,为每个信息项构建相应的查找表,以查找表中的内容对识别信息进行比对。
可选地,将信息项划分为具有上下顺位的不同类别,为不同类别的信息项对应设置有对应级别的查找表。
可选地,记录信息项之间的关联情况,对任意一个信息项的内容通过与之关联的信息项的内容进行验证。
可选地,通过与信息项对应的格式模板进行信息识别;
所述格式模板中定义了信息项的固有位置、固有格式、固有内容、固有表达方式中的一项或若干项的组合。
可选地,所述识别系统中设置有信息识别模块,对图像中的信息进行初步识别;
再通过所述分类器,对初步识别后的信息进行分类;
之后,将分类结果反馈至所述信息识别模块进行精确识别。
可选地,所述识别系统中设置有信息校正模块,基于信息分类结果及其查找表、信息项关联情况、格式模板,对识别信息进行校正。
可选地,在查找表中预先设置与识别信息中格式及内容固定的信息项对应的内容;还将经过精确识别或校正后的信息项的内容在查找表中进行更新。
可选地,通过与所述信息校正模块信号连接的信息补录模块,对遗漏或错误识别的信息进行校正。
可选地,所述识别系统中设置有预处理模块,对图像进行包含二值化的预处理;还设置有版面分析模块,从预处理过的图像中提取出识别区域,使信息识别模块对识别区域信进行信息识别。
可选地,所述识别系统中设置有多个分类器,以不同的特征各自进行信息分类;对各分类器分别设置阈值来筛选其信息分类结果,将多个分类器的信息分类结果融合后输出。
本发明提供的基于影像档案电子资料识别系统中分类器的识别方法,其优点在于:本发明能够自动识别扫描图像,从中提取有用信息,并按照一定的分类规则保存到数据库中,供用户检索、查询,最大程度减少用户的工作量。本发明利用多分类器融合方法来提高字符的识别率;运用多区域多内容冗余校验的方法对不同信息项内容进行比对,保证识别结果的充分可信赖性,提高了识别效率。
附图说明
图1是本发明中影像档案电子资料的识别系统的示意图;
图2是本发明识别系统中信息分类过程的示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海珉智信息科技有限公司,未经上海珉智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410262741.7/2.html,转载请声明来源钻瓜专利网。





