[发明专利]一种票据识别方法及装置在审
申请号: | 201910386149.0 | 申请日: | 2019-05-09 |
公开(公告)号: | CN110956739A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 徐青松;李青 | 申请(专利权)人: | 杭州睿琪软件有限公司 |
主分类号: | G07D7/20 | 分类号: | G07D7/20;G06K9/32;G06K9/34 |
代理公司: | 上海思捷知识产权代理有限公司 31295 | 代理人: | 王宏婧 |
地址: | 310053 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 票据 识别 方法 装置 | ||
本发明提供了一种票据识别方法及装置,所述方法包括:获得待识别的票据的图像;采用区域识别模型,识别所述图像中所述票据的各个行区域;其中,所述行区域为每一行字符所在的区域;采用字符识别模型,识别每一行区域中的字符内容;根据每一行区域的字符内容,确定所述票据的时间信息、店铺名称以及付款金额。应用本发明提供的方案可以自动识别票据上的相关信息。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种票据识别方法、装置、电子设备和计算机可读存储介质。
背景技术
随着经济的不断发展,人们的消费水平不断的提高,为了维护人们的消费权益,票据成为了消费者的有力保障以及有效的报销凭证,因此财务人员每天需要处理大量的票据,获取票据上的相关信息,如开票时间、开票店铺、付款金额等。同时也有越来越多的人通过记账分类统计以掌握自身的消费情况,目前人们通常是通过手动记录票据中相关信息的方式进行记账的。因此如何自动识别票据上的相关信息对财务人员以及有记账分类统计的个人来说是十分重要的。
发明内容
本发明的目的在于提供一种票据识别方法、装置、电子设备和计算机可读存储介质,以自动识别票据上的相关信息。具体技术方案如下:
第一方面,本发明提供了一种票据识别方法,所述方法包括:
获得待识别的票据的图像;
采用区域识别模型,识别所述图像中所述票据的各个行区域;其中,所述行区域为每一行字符所在的区域,所述区域识别模型为基于神经网络的模型;
采用字符识别模型,识别每一行区域中的字符内容;其中,所述字符识别模型为基于神经网络的模型;
根据每一行区域的字符内容,确定所述票据的时间信息、店铺名称以及付款金额;
其中,根据每一行区域的字符内容,确定所述票据的付款金额,包括:
将字符内容中包含至少一个预设关键词的至少一个行区域确定为金额汇总区域;
根据所述金额汇总区域的字符内容,确定所述票据的付款金额。
可选的,所述方法还包括:
在识别所述图像中所述票据的各个行区域的过程中,采用所述区域识别模型识别时间区域,并将所述时间区域进行标注,其中,所述时间区域为符合预设时间特征的行区域;
根据每一行区域的字符内容,确定所述票据的时间信息,包括:
根据所述时间区域的字符内容,确定所述票据的时间信息。
可选的,根据每一行区域的字符内容,确定所述票据的店铺名称,包括:
根据每一行区域的字符内容在店名数据库中进行搜索,确定所述票据的店铺名称。
可选的,当所述票据中包含图案时,所述方法还包括:
采用区域识别模型,识别所述图像中所述图案所在的区域;
根据所述图案判断所述店名数据库中是否存在相匹配的店名图案;如果存在,将相匹配的店名图案对应的店铺名称确定为所述票据的店铺名称,如果不存在,则识别所述图案中的字符作为所述票据的店铺名称;如果所述图案中没有字符,再执行所述根据每一行区域的字符内容在店名数据库中进行搜索,确定所述票据的店铺名称的步骤;
其中,所述店名数据库中每一店名图案均标注有对应的店铺名称。
可选的,如果根据每一行区域的字符内容在店名数据库中进行搜索,无法确定所述票据的店铺名称,则从每一行区域的字符内容中确定店铺地址,将所述店铺地址作为所述票据的店铺名称。
可选的,从每一行区域的字符内容中确定店铺地址,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州睿琪软件有限公司,未经杭州睿琪软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910386149.0/2.html,转载请声明来源钻瓜专利网。