[发明专利]大票据图片文字识别方法有效
申请号: | 201711403971.0 | 申请日: | 2017-12-22 |
公开(公告)号: | CN109977723B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 詹智财;罗阳;周鹏程;代稳 | 申请(专利权)人: | 苏宁云商集团股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06Q40/00 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
地址: | 210042 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 图片 文字 识别 方法 | ||
本发明属于模式识别与人工智能技术领域,公开了一种大票据图片文字识别方法,所述方法包括:所述方法包括:将纸质票据转化为图片格式;对形成为图片格式的票据进行图像预处理;对预处理后的票据图片进行区域分割,得到该票据图片的多个图片块;对票据图片的多个图片块进行文本行区域的目标检测;对多个图片块中获取的各文本行区域进行融合,得到完整的文本行区域;获取票据图片中完整的文本行区域,进行图片文字转计算机文字;基于不同纸质票据的需求,给出特定区域的计算机文字结果。本发明解决了原有的票据识别耗时较长、易出错且识别过程复杂的问题。
技术领域
本发明属于模式识别与人工智能技术领域,尤其是涉及一种大票据图片文字识别方法。
背景技术
随着企业的不断壮大以及企业流水的日益增长,企业票据数量也在不断增多,其中涉及到供应商开出的票据,企业员工出差需要报销的票据等等。而面对成千上万的企业票据,如何基于计算机技术,快速且高效的进行企业票据的自动识别成了大家关心的热点。现有处理企业纸质票据有以下几种方式:(1)通过招募对应岗位的人员,在基于人工肉眼识别基础上,开发一定的录入系统,通过人工的方式对票据所需要录入的信息进行手工录入和后续操作;(2)基于数字图像处理的方法,通过对纸质票据的图片进行预先分析,采用模版的方法对票据的固定区域进行操作,如图像二值化,前背景分离,前景轮廓提取,然后采用模式识别方法如图片文字分类,或者现有成熟的光学字符识别库,如谷歌维护的tesseract等对检测到的图片文字转换成计算机文字。
但是,上述方法都有着较为严重的缺陷:对于方法(1)来说,该方法不适用大规模票据的自动处理,且人工容易疲劳,随着人工工作时间的变长,疲劳会导致无论是票据处理的数量还是质量都会有所下降;对于方法(2)来说,这种方法虽然解决了方法(1)中的数量问题,然而基于不同类型的纸质票据,需要编写不同的模版处理流程,对于程序的开发以及后续维护问题较大,且基于传统的数字图像处理方法对图片本身包含的光照,字符清晰程度等属性有着非常严格的限制,并且针对图片本身大小也有一定的限制。
发明内容
针对现有技术中存在的上述缺陷,本发明的目的是提供一种大票据图片文字识别方法,以解决原有的票据识别耗时较长、易出错且识别过程复杂的问题。
本发明采用的技术方案如下:
一种大票据图片文字识别方法,所述方法包括:
S1、对纸质票据进行扫描,获取纸质票据图片;
S2、对纸质票据图片进行图像预处理;
S3、对图像预处理后的纸质票据图片进行区域分割,得到该纸质票据图片的多个图片块;
S4、对纸质票据图片的多个图片块进行文本行区域的目标检测;
S5、对多个图片块中获取的文本行区域进行融合,得到完整的文本行区域;
S6、获取纸质票据图片中完整的文本行区域,进行图片文字转计算机文字;
S7、基于不同纸质票据的需求,给出特定区域的计算机文字结果。
进一步的,在上述步骤S1中,对票据进行扫描的具体过程为:
基于字迹清晰,文字之间没有重叠的纸质票据基础上,设置扫描仪的dpi为300,并且正面对齐不要旋转,扫描出来的图片为I,其中I∈[0,255]H×W×3,是一个高度为H,宽度为W的3通道RGB图片,其中每个像素点取值为[0,255]。
进一步的,在获取纸质票据图片的基础上,对图片进行一定程度的图像预处理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云商集团股份有限公司,未经苏宁云商集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711403971.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可转动的电子支付装置
- 下一篇:一种水下目标分类方法