[发明专利]凭证图像识别方法及装置在审
申请号: | 201611189226.6 | 申请日: | 2016-12-21 |
公开(公告)号: | CN106650718A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 鲁静;宋斌;向万红 | 申请(专利权)人: | 远光软件股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 珠海智专专利商标代理有限公司44262 | 代理人: | 林永协,李谨 |
地址: | 519085 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 凭证 图像 识别 方法 装置 | ||
技术领域
本发明涉及图像自动识别领域,尤其涉及一种对各种凭证进行光学字符识别后对凭证的内容进行识别的方法以及实现这种方法的装置。
背景技术
人们在日常的消费过程中,往往产生大量的凭证,如乘坐飞机,将会有登机牌或者航程单,乘坐火车或汽车会有火车票或者汽车票,到餐馆吃饭可以获得餐饮发票等,这些凭证都是财务报销的依据,因此,如人们在差旅过程中产生这些凭证,在差旅结束后需要将这些凭证交给财务部门,由财务部门核实并且予以报销。
由于凭证种类众多,且每一张凭证均包含大量的数据,以火车票为例,凭证上包括乘车日期、乘客姓名、车次号、乘车日期与时间、座号、乘客身份证号码、金额等,报销时往往需要将这些信息录入到报销系统中。如果人工地将这些信息录入系统,工作量将非常巨大。此外,在人数众多的企业,差旅报销的凭证数量巨大,如每一张凭证均人工录入,将严重影响财务部门的工作量。
为此,人们开发出基于光学字符识别(OCR,optical character recognition)的凭证图像识别系统,即通过光学字符识别技术将凭证上的字符识别出来,将识别出来的字符自动填写到报销系统相应的栏目上,从而避免人工输入凭证信息。使用这种系统时,需要通过拍摄装置将凭证拍照,然后使用报销系统对拍摄的凭证图像进行光学字符识别,从而获取相应的信息。
目前普遍的基于光学字符识别的报销系统都只能识别出凭证上的文字和符号,而不能分析原始凭证的版面结构,也不能理解凭证上的内容。在对凭证做光学字符识别后,需要设计模板对凭证进行版面分析,以理解识别出的字符的具体含义。传统的做法是设计一个固定模板对凭证信息进行框选,用户拍摄凭证时将固定目标对准凭证图像。然而固定模板“套不准”的情况经常发生,不仅影响识别率,也影响了用户体验。此外,固定模板仅适用于结构固定、元素位置相对不变的凭证,而实际应用时即使同类凭证的版面结构也并不是一成不变的,如火车票的版面也经常发生变化。正因如此,现有的凭证图像识别系统无法高效、准确的识别凭证图像,影响财务报销的效率。
发明内容
本发明的主要目的是提供一种能够对不同类型、不同版面的凭证图像进行高效识别的凭证图像识别方法。
本发明的另一目的是提供一种能够高效地对识别不同类型凭证的凭证识别装置。
为了实现上述的主要目的,本发明提供的凭证识别方法包括读取凭证图像,对所读取的凭证图像进行光学字符识别;并且,提取凭证图像的特征信息,根据特征信息判断凭证图像是否与固定结构的模板匹配,如是,则提取凭证图像中的特征元素的数据;如判断凭证图像不与任一固定结构的模板匹配,则进一步判断凭证图像是否为特定分类的凭证,如是,将凭证图像与该分类的弹性模板匹配,并识别凭证图像中的特征元素,提取特征元素的数据;如判断凭证图像不是特定分类的凭证,则将凭证图像的特征信息遍历所有模板,并查找到最匹配的模板后识别凭证图像中的特征元素,提取凭证图像中的特征元素的数据。
由上述方案可见,提取凭证图像的特征信息后,首先判断图像凭证是否与固定结构的模板匹配,如匹配则直接按照固定结构的模板提取特征元素的数据,如果不是与固定结构的模板匹配,则通过分类器判断凭证是否为特定分类的凭证,并且通过匹配弹性模板的方式识别出各个特征元素,从而获取各个特征元素的数据。
这样,在识别凭证图像时,并不会只能对固定结构的模板进行识别,并且一旦判断不与固定结构的模板匹配时,也不会直接遍历所有模板,而是识别出凭证的分类后,通过匹配弹性模板的方式查找出凭证的分类,并且根据弹性模板分析出凭证上各个特征元素,再提取特征元素的数据,从而避免花费较长时间遍历所有模板,凭证图像识别的时间大大缩短。
一个优选的方案是,每一弹性模板包括所属特定分类中至少一个特征元素。由于弹性模板是特定分类的凭证,因此凭证图像应该包含有所属分类的凭证的特征元素,因此识别凭证图像时,分析出凭证图像中所属分类的凭证的特征元素,可以提高凭证图像的识别效率。
进一步的方案是,特征信息至少包括静态文本、特殊符号、分隔符、条码或二维码、空白区域中的一个。
由此可见,通过识别凭证图像中诸如静态文本、特殊符号、分隔符、条码或二维码、空白区域的特征来辨别凭证图像的分类,可以快速确定凭证的类型,从而快速获取凭证图像中的特征元素的数据。
更进一步的方案是,判断凭证图像是否为特定分类的凭证包括:搜索凭证图像中的静态文本后,搜索凭证图像中的特征元素的字段,并搜索已查找的特征元素的邻近字段,根据静态文本、特征元素的字段确定凭证图像的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于远光软件股份有限公司,未经远光软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611189226.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:抱枕(图形创意)
- 下一篇:识别图片文字的方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序