[发明专利]大票据图片文字识别方法有效

专利信息
申请号: 201711403971.0 申请日: 2017-12-22
公开(公告)号: CN109977723B 公开(公告)日: 2021-10-22
发明(设计)人: 詹智财;罗阳;周鹏程;代稳 申请(专利权)人: 苏宁云商集团股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/34;G06Q40/00
代理公司: 北京市万慧达律师事务所 11111 代理人: 黄玉东
地址: 210042 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 票据 图片 文字 识别 方法
【说明书】:

发明属于模式识别与人工智能技术领域,公开了一种大票据图片文字识别方法,所述方法包括:所述方法包括:将纸质票据转化为图片格式;对形成为图片格式的票据进行图像预处理;对预处理后的票据图片进行区域分割,得到该票据图片的多个图片块;对票据图片的多个图片块进行文本行区域的目标检测;对多个图片块中获取的各文本行区域进行融合,得到完整的文本行区域;获取票据图片中完整的文本行区域,进行图片文字转计算机文字;基于不同纸质票据的需求,给出特定区域的计算机文字结果。本发明解决了原有的票据识别耗时较长、易出错且识别过程复杂的问题。

技术领域

本发明属于模式识别与人工智能技术领域,尤其是涉及一种大票据图片文字识别方法。

背景技术

随着企业的不断壮大以及企业流水的日益增长,企业票据数量也在不断增多,其中涉及到供应商开出的票据,企业员工出差需要报销的票据等等。而面对成千上万的企业票据,如何基于计算机技术,快速且高效的进行企业票据的自动识别成了大家关心的热点。现有处理企业纸质票据有以下几种方式:(1)通过招募对应岗位的人员,在基于人工肉眼识别基础上,开发一定的录入系统,通过人工的方式对票据所需要录入的信息进行手工录入和后续操作;(2)基于数字图像处理的方法,通过对纸质票据的图片进行预先分析,采用模版的方法对票据的固定区域进行操作,如图像二值化,前背景分离,前景轮廓提取,然后采用模式识别方法如图片文字分类,或者现有成熟的光学字符识别库,如谷歌维护的tesseract等对检测到的图片文字转换成计算机文字。

但是,上述方法都有着较为严重的缺陷:对于方法(1)来说,该方法不适用大规模票据的自动处理,且人工容易疲劳,随着人工工作时间的变长,疲劳会导致无论是票据处理的数量还是质量都会有所下降;对于方法(2)来说,这种方法虽然解决了方法(1)中的数量问题,然而基于不同类型的纸质票据,需要编写不同的模版处理流程,对于程序的开发以及后续维护问题较大,且基于传统的数字图像处理方法对图片本身包含的光照,字符清晰程度等属性有着非常严格的限制,并且针对图片本身大小也有一定的限制。

发明内容

针对现有技术中存在的上述缺陷,本发明的目的是提供一种大票据图片文字识别方法,以解决原有的票据识别耗时较长、易出错且识别过程复杂的问题。

本发明采用的技术方案如下:

一种大票据图片文字识别方法,所述方法包括:

S1、对纸质票据进行扫描,获取纸质票据图片;

S2、对纸质票据图片进行图像预处理;

S3、对图像预处理后的纸质票据图片进行区域分割,得到该纸质票据图片的多个图片块;

S4、对纸质票据图片的多个图片块进行文本行区域的目标检测;

S5、对多个图片块中获取的文本行区域进行融合,得到完整的文本行区域;

S6、获取纸质票据图片中完整的文本行区域,进行图片文字转计算机文字;

S7、基于不同纸质票据的需求,给出特定区域的计算机文字结果。

进一步的,在上述步骤S1中,对票据进行扫描的具体过程为:

基于字迹清晰,文字之间没有重叠的纸质票据基础上,设置扫描仪的dpi为300,并且正面对齐不要旋转,扫描出来的图片为I,其中I∈[0,255]H×W×3,是一个高度为H,宽度为W的3通道RGB图片,其中每个像素点取值为[0,255]。

进一步的,在获取纸质票据图片的基础上,对图片进行一定程度的图像预处理,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云商集团股份有限公司,未经苏宁云商集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711403971.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top