[发明专利]一种基于OCR的单据自动识别方法在审

专利信息
申请号: 202010494704.4 申请日: 2020-06-03
公开(公告)号: CN111680679A 公开(公告)日: 2020-09-18
发明(设计)人: 何昱 申请(专利权)人: 重庆数道科技有限公司
主分类号: G06K9/20 分类号: G06K9/20
代理公司: 北京盛凡智荣知识产权代理有限公司 11616 代理人: 张塨
地址: 400000 重庆*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 ocr 单据 自动识别 方法
【说明书】:

本申请公开了一种基于OCR的单据自动识别方法,方法包括依次通过OCR提取文本、单据类型识别、单据模板识别、通用识别规则识别文字含义及识别文字归集,完成对物流运输中单据的文本识别,同时通过对其中车牌ID识别过程中的误差校正提高了识别精度。本申请达到了从一段无序、意义缺失的文字中提取出货物运输的要素的效果,从而了提高文本识别的准确率,以及物流运输检测的工作效率。

技术领域

本申请涉及物流运输检测技术领域,具体而言,涉及一种基于OCR的单据自动识别方法。

背景技术

在建筑物料运输行业中,物流公司负责将建筑需要的原材料从工厂运输到施工工地,在物料的运输和交割过程中会对大量的纸质单据进行处理,该类单据是用于物流公司在后期向托运方收取费用的依据。由于物流公司的发货,收货方较多,每个收发货单位的单据格式、质量、清晰度是不同的,因此就造成了单据样式多样化,单据质量多样化,单据信息多样化等问题。将纸质单据上的涉及发货地、收货地、进厂时间、出厂时间、拉货车牌号、货物重量、收货进厂时间、收货出厂时间等信息转化为文本格式,然后形成对账报表就成为了物流运输企业必然需要去处理之事,目前,各个物流公司均采用人工手工将纸质单据信息录入电脑中的方式来解决该类问题,其解决过程需要耗费大量的人力,人工成本较高;同时其工作过程单调、重复度高,极容易产生人工失误,混乱物流程序。

为解决上述问题,现有技术中出现了光学文本识别(OpticalCharacterRecognition,OCR),OCR针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术,目前被广泛用于手写识别、打印识别及文本图像识别等相关领域。不论是文档识别、银行卡身份证识别等小型识别场景,还是广告、海报等大型识别场景,均可通过OCR技术大展拳脚,该技术极大简化了图像数据处理的流程。

对于OCR技术的应用,例如公开号为CN109241826B的发明专利,一种基于OCR技术的识别医学单据系统和方法,其系统包括单据头进入检测装置、单据尾进入检测装置、单据头排出检测装置、单据尾排出检测装置、恒定磁场发生器、线性光学传感器组、线性初始磁传感器组、线性校验磁传感器组、平行光光源、第一数据封装处理器、状态判断处理器和控制信号生成处理器,该发明利用两种不同类型的物理信号识别同一单据形成两种内容表达正相关的图像,利用物理信号的差异过滤光学图像中的非字符识别内容,定位字符识别内容区域,减轻了OCR识别的难度和数据处理负荷,节约了时间成本和硬件成本。再例如公开号为CN110599317A的发明专利,一种基于规则引擎和OCR的报账及审核自动化方法,该发明主要通过在员工报账扫描时引入OCR识别,识别出员工报账的各类票据信息,并将识别的信息存储至数据库中,再利用预先在规则引擎中配置的校验规则匹配识别的信息,进行自动填写电子单据信息,并在员工保存或提交电子单据信息时提醒员工不规范的填写点,提升了员工报账体验以及降低开发及运维成本。

上述专利技术虽然对OCR识别方法进行了改进,提高了处理效率,但均为对实际的单据识别中的识别率问题进行克服,解决该类问题,借助于光学字符识别只是第一步,更重要的是赋予图像转换而来的文本以含义,否则只是单纯的一堆文字,并不会产生任何含义。例如百度基于光学字符识别技术推出了其iocr(智能OCR)方案,基于文字在图片上出现的位置以及其左右、前后的参照文本来确认指定位置出现内容的现实含义,在上述场景下面临了单据格式多样化、质量不均衡、单据信息多样化等问题,同样内容的文本出现的位置会有偏差,因此导致此种方法对文本含义的识别困难较大,识别率较低,无法实际应用;如图3所示,对于数字、字母和文字所组合的文本识别也时常出现此类错误,图文处理能力低下了;基于机器学习的语义识别技术也仅能识别有自然含义的语句,而对于词组的含义却无法识别。因此为了解决上述问题,本领域亟待一种对纸质单据上文本的含义进行准确识别的方法。

发明内容

本申请的主要目的在于提供一种基于OCR的单据自动识别方法,以提高文本识别的准确率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆数道科技有限公司,未经重庆数道科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010494704.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top