[发明专利]一种基于扫描仪混扫的票据识别方法及系统有效
申请号: | 201810483410.4 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108777021B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 李小英;王卓静;张帅 | 申请(专利权)人: | 北京大账房网络科技股份有限公司 |
主分类号: | G07D7/20 | 分类号: | G07D7/20 |
代理公司: | 北京孚睿湾知识产权代理事务所(普通合伙) 11474 | 代理人: | 刘翠芹;孙建 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 扫描仪 票据 识别 方法 系统 | ||
1.一种基于扫描仪混扫的票据识别方法,其特征在于:其包括以下步骤:
S1、智能识别系统对多种类型的票据进行自动识别和智能分析学习后,对各类型的票据的关键信息进行存储,识别各类型票据不同的关键信息并为银行票据、机打发票、火车票以及定额发票定义关键字,通过在扫描票据过程中不断训练存储,建立票据关键信息数据库,票据关键信息数据库包括识别顺序列表、关键字列表、关键信息列表以及对应的票据类型列表,关键字列表、关键信息列表以及对应的票据类型列表是一一对应的,票据关键信息数据库如下:
识别顺序列表分为第一类、第二类、第三类、第四类、第五类和第六类;
当识别顺序列表为第一类时,票据类型列表为增值税普通发票、卷式发票、增值税电子普通发票,关键字列表为无,关键信息列表为发票代码,发票号码,日期,查验码;
当识别顺序列表为第二类时,票据类型列表为机动车销售统一发票和增值税专用发票,关键字列表为无,关键信息列表为发票代码,发票号码,日期,金额;
当识别顺序列表为第三类时,票据类型列表为银行票据,关键字列表为企业网银手续费,收付款入账通知,客户收付款入账,结算账户付款凭证,转账汇款手续费,现金交款单,关键信息列表为银行名称,单据名称,收款方名称,付款方名称,日期,金额,备注信息;
当识别顺序列表为第四类时,票据类型列表为机打发票,关键字列表为机打发票,关键信息列表为金额;
当识别顺序列表为第五类时,票据类型列表为火车票,关键字列表为铁路,12306,硬座,软座,商务座,一等座,二等座,硬卧,软卧,关键信息列表为出发地,目的地,日期,金额;
当识别顺序列表为第六类时,票据类型列表为定额发票,关键字列表为定额发票,关键信息列表为金额;
S2、通过扫描仪将各种混合票据扫描成为电子版图像,上传至智能识别系统获取关键字,对于倾斜和旋转的图片,智能识别系统自动识别并校正;
S3、对得到的电子版图像根据扫描得到的信息与存储的关键信息或关键字进行比对,获取该票据的票据类型,对比顺序按照识别顺序列表的顺序进行,如果票据类型为识别顺序列表中第一类和第二类的发票,则进行查验,如查验成功,则将查验结果返回至智能识别终端进行显示,如查验失败,则将该发票归为查验错误类;如果票据类型为第一类和第二类的发票之外的发票类型,则将该发票的发票类型直接返回至智能识别终端进行显示,如果无法识别该发票的发票类型,则将该无法识别发票类型的发票归为无法识别类并返回识别结果;具体包括以下步骤:
S31、对得到的电子版图像直接提取关键信息,如果能直接提取到关键信息则首先将扫描得到的关键信息与票据关键信息数据库中存储的关键信息列表中的增值税普通发票、卷式发票、增值税电子普通发票、机动车销售统一发票或增值税专用发票的关键信息列进行对比,如果该发票属于增值税普通发票、卷式发票、增值税电子普通发票、机动车销售统一发票或增值税专用发票中的一类,则进行查验,如查验成功则返回发票类型及该发票类型对应的关键信息,如查验失败,则将该发票归为查验错误类并返回发票类型及对应的关键信息;如果该发票不属于增值税普通发票、卷式发票、增值税电子普通发票、机动车销售统一发票或增值税专用发票中的一类,则进行关键字提取并根据提取到的关键字获取该关键字对应的关键信息并进入步骤S32;
S32、将提取到的关键字与票据关键信息数据库中存储的关键字列表中的银行票据的关键字列进行对比,如果该发票属于银行票据,则根据关键字识别关键字中包含的关键信息,返回票据类型及对应的关键信息,如果该发票不属于银行票据,则进入步骤S33;
S33、将提取到的关键字与票据关键信息数据库中存储的关键字列表中的机打发票的关键字列进行对比,如果该发票属于机打发票,则根据关键字识别关键字中包含的关键信息,返回票据类型及对应的关键信息,如果该发票不属于机打发票,则进入步骤S34;
S34、将提取到的关键字与票据关键信息数据库中存储的关键字列表中的火车票的关键字列进行对比,如果该发票属于火车票,则根据关键字识别关键字中包含的关键信息,返回票据类型及对应的关键信息,如果该发票不属于火车票,则进入步骤S35;
S35、将提取到的关键字与票据关键信息数据库中存储的关键字列表中的定额发票的关键字列进行对比,如果该发票属于定额发票,则根据关键字识别关键字中包含的关键信息,返回票据类型及对应的关键信息,如果该发票不属于定额发票,则进入步骤S36;
S36、如果无法识别该发票的发票类型,则将所述无法识别发票类型的发票归为无法识别类并返回识别结果;
S4、对无法识别类或查验错误类的发票经图像处理后进行二次识别,所述图像处理的方法根据无法识别的具体原因进行确定,图形处理的具体方法包括锁定关键信息位置,根据像素点的坐标进行切块、消除红章、去除线条或对残缺的数字进行机器学习训练;
S5、在对无法识别类或查验错误类的发票二次识别后,重复步骤S1-S3,获取最终的票据类型以及该票据类型对应的关键信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大账房网络科技股份有限公司,未经北京大账房网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810483410.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:减轻工作量的公交车用投币机
- 下一篇:一种钞票存储装置