[发明专利]一种发票识别方法及设备、介质在审
| 申请号: | 202010073318.8 | 申请日: | 2020-01-22 |
| 公开(公告)号: | CN111291752A | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 范琳琳 | 申请(专利权)人: | 山东浪潮通软信息科技有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32 |
| 代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 董延丽 |
| 地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 发票 识别 方法 设备 介质 | ||
本申请公开了一种发票识别方法及设备、介质。方法包括:获取待识别的发票图像;在所述待识别的发票图像中进行文本区域检测,得到文本区域框;根据所述文本区域框,计算旋转角度,并根据所述旋转角度,对所述文本区域框进行旋转;对所述旋转后的文本区域框进行剪裁;根据所述剪裁后的文本区域框,识别文本。本申请有助于在发票图像中排除留白区域和摆正文本,更精确地定位出文本所在区域,从而有助于更高效准确地识别发票文本。
技术领域
本申请涉及图像处理技术领域,尤其涉及一种发票识别方法及设备、介质。
背景技术
近几年来,随着社会经济的飞速发展,经济活动日益频繁,无论是普通消费者还是各种类型的企业对消费开具发票、凭票才能进行报销的认识日益深刻。企业在费用报销的时候,通常都需要财务人员将发票上的关键信息进行人工录入和人工核对,这样不仅增加了财务工作人员的工作量,而且大量重复、繁琐的工作,很容易让工作人员产生疲劳感,从而出现缺录,少录的情况,从而使得在报账的过程中出现错误。为了提高财务工作人员的工作效率及在录入发票的准确率,一种只需要上传一张发票图像,自动将发票信息录入的需求就应运而生。
在现有技术中,往往会识别出发票中本身已经划出的各个方框,然后在方框内直接识别文本。
但是,在实际应用中,方框内除了文本之外,通常还有大块留白区域,不仅如此,在方框内的文本本身可能位置不正,这些因素会降低对发票文本的识别效率和准确性。
发明内容
本申请实施例提供一种发票识别方法及设备、介质,用以解决现有技术中的如下技术问题:目前在发票中本身已经划出的各个方框内直接识别文本,而方框内除了文本之外,通常还有大块留白区域,不仅如此,在方框内的文本本身可能位置不正,这些因素会降低对发票文本的识别效率和准确性。
本申请实施例采用下述技术方案:
一种发票识别方法,包括:
获取待识别的发票图像;
在所述待识别的发票图像中进行文本区域检测,得到文本区域框;
根据所述文本区域框,计算旋转角度,并根据所述旋转角度,对所述文本区域框进行旋转;
对所述旋转后的文本区域框进行剪裁;
根据所述剪裁后的文本区域框,识别文本。
可选地,所述获取待识别的发票图像前,所述方法还包括:
接收输入的原始的发票图像;
检测所述原始的发票图像的摆放朝向是否符合预定朝向;
若是,则将所述原始的发票图像作为所述待识别的发票图像;
否则,将所述原始的发票图像进行旋转,以使所述旋转后的原始的发票图像的摆放朝向符合所述预定朝向,将所述旋转后的原始的发票图像作为所述待识别的发票图像,其中,该旋转的旋转角度为90度的整倍数。
可选地,所述旋转所述文本区域框的旋转角度的绝对值不大于45度。
可选地,所述根据所述文本区域框,计算旋转角度,包括:
确定所述文本区域框的坐标位置信息;
根据所述坐标位置信息,计算所述文本区域框内文本对应的最小轮廓矩形;
根据所述最小轮廓矩形,确定旋转角度。
可选地,所述根据所述旋转角度,对所述文本区域框进行旋转,包括:
确定所述文本区域框的中心点;
根据所述中心点和所述旋转角度,计算仿射变换矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮通软信息科技有限公司,未经山东浪潮通软信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010073318.8/2.html,转载请声明来源钻瓜专利网。





