[发明专利]大票据图片文字识别方法有效

申请号：	201711403971.0	申请日：	2017-12-22
公开（公告）号：	CN109977723B	公开（公告）日：	2021-10-22
发明（设计）人：	詹智财;罗阳;周鹏程;代稳	申请（专利权）人：	苏宁云商集团股份有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06Q40/00
代理公司：	北京市万慧达律师事务所 11111	代理人：	黄玉东
地址：	210042 江苏省***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	票据图片文字识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于模式识别与人工智能技术领域，公开了一种大票据图片文字识别方法，所述方法包括：所述方法包括：将纸质票据转化为图片格式；对形成为图片格式的票据进行图像预处理；对预处理后的票据图片进行区域分割，得到该票据图片的多个图片块；对票据图片的多个图片块进行文本行区域的目标检测；对多个图片块中获取的各文本行区域进行融合，得到完整的文本行区域；获取票据图片中完整的文本行区域，进行图片文字转计算机文字；基于不同纸质票据的需求，给出特定区域的计算机文字结果。本发明解决了原有的票据识别耗时较长、易出错且识别过程复杂的问题。

技术领域

本发明属于模式识别与人工智能技术领域，尤其是涉及一种大票据图片文字识别方法。

背景技术

随着企业的不断壮大以及企业流水的日益增长，企业票据数量也在不断增多，其中涉及到供应商开出的票据，企业员工出差需要报销的票据等等。而面对成千上万的企业票据，如何基于计算机技术，快速且高效的进行企业票据的自动识别成了大家关心的热点。现有处理企业纸质票据有以下几种方式：(1)通过招募对应岗位的人员，在基于人工肉眼识别基础上，开发一定的录入系统，通过人工的方式对票据所需要录入的信息进行手工录入和后续操作；(2)基于数字图像处理的方法，通过对纸质票据的图片进行预先分析，采用模版的方法对票据的固定区域进行操作，如图像二值化，前背景分离，前景轮廓提取，然后采用模式识别方法如图片文字分类，或者现有成熟的光学字符识别库，如谷歌维护的tesseract等对检测到的图片文字转换成计算机文字。

但是，上述方法都有着较为严重的缺陷：对于方法(1)来说，该方法不适用大规模票据的自动处理，且人工容易疲劳，随着人工工作时间的变长，疲劳会导致无论是票据处理的数量还是质量都会有所下降；对于方法(2)来说，这种方法虽然解决了方法(1)中的数量问题，然而基于不同类型的纸质票据，需要编写不同的模版处理流程，对于程序的开发以及后续维护问题较大，且基于传统的数字图像处理方法对图片本身包含的光照，字符清晰程度等属性有着非常严格的限制，并且针对图片本身大小也有一定的限制。

发明内容

针对现有技术中存在的上述缺陷，本发明的目的是提供一种大票据图片文字识别方法，以解决原有的票据识别耗时较长、易出错且识别过程复杂的问题。

本发明采用的技术方案如下：

一种大票据图片文字识别方法，所述方法包括：

S1、对纸质票据进行扫描，获取纸质票据图片；

S2、对纸质票据图片进行图像预处理；

S3、对图像预处理后的纸质票据图片进行区域分割，得到该纸质票据图片的多个图片块；

S4、对纸质票据图片的多个图片块进行文本行区域的目标检测；

S5、对多个图片块中获取的文本行区域进行融合，得到完整的文本行区域；

S6、获取纸质票据图片中完整的文本行区域，进行图片文字转计算机文字；

S7、基于不同纸质票据的需求，给出特定区域的计算机文字结果。

进一步的，在上述步骤S1中，对票据进行扫描的具体过程为：