[发明专利]一种电子单据管理方法、装置、计算机设备及存储介质在审
申请号: | 202010123374.8 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111340024A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 何云飞;任福平;吴昊 | 申请(专利权)人: | 深圳市赤狐软件技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/42;G06K9/40;G06K9/72 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 刘贻盛 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 单据 管理 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种电子单据管理方法、装置、计算机设备及存储介质,方法包括:接收电子单据图像,并对电子单据图像进行裁剪和缩放;对所述电子单据图像进行图像灰度化处理和滤波处理;对所述电子单据图像进行边缘查找处理得到二值化图像;对所述二值化图像进行像素邻域计算得到像素连通区域;对所述像素连通区域进行区域兼并运算,以兼并字符单元得到字符单元集合;对字符单元集合进行逐个截取得到文字图像;获取所述文字图像中的关键字以及对应的数据并保存至对应的电子单据记录中;将所述电子单据记录中的内容展示到应用系统web页面上。通过本发明,可以提高电子单据的录入效率以及准确率。
技术领域
本发明涉及单据管理领域,尤其涉及一种电子单据管理方法、装置、计算机设备及存储介质。
背景技术
商务活动中,采购商与芯片供应商之间,频繁的商务动作会产生大量的单据。特别是大中型企业,品种繁多、数量庞大的货物供求过程中,产生的各种单据,其管理过程中,如果采用手工录入的方式处理,过程非常繁琐并且容易出错,并且很难实现商务活动和数据录入输出的实时性和可靠性。
发明内容
本发明实施例提供了一种电子单据管理方法、装置、计算机设备及存储介质,旨在解决现有技术中单据录入效率低、容易出错等问题。
本发明实施例提供一种基于图像识别的电子单据管理方法,其包括:
接收电子单据图像,并对电子单据图像进行裁剪和缩放;
对所述电子单据图像进行图像灰度化处理和滤波处理;
对所述电子单据图像进行边缘查找处理得到二值化图像;
对所述二值化图像进行像素邻域计算得到像素连通区域;
对所述像素连通区域进行区域兼并运算,以兼并字符单元得到字符单元集合;
对字符单元集合进行逐个截取得到文字图像;
获取所述文字图像中的关键字以及对应的数据并保存至对应的电子单据记录中;
将所述电子单据记录中的内容展示到应用系统web页面上。
优选的,所述获取所述文字图像中的关键字以及对应的数据并保存至对应的电子单据记录中,包括:
收集历史电子单据;
挖掘历史电子单据中的关键字并进行整合,并存储到关键字表中;
将所述关键字表中的关键字加载到redis服务;
将所述文字图像中的内容与redis服务中的关键字进行匹配;
若匹配成功,则获取所述文字图像中的关键字并依据所述关键字获取对应的数据;
将获取到的关键字以及对应的数据保存至对应的电子单据记录中。
优选的,所述将所述文字图像中的内容与redis服务中的关键字进行匹配,包括:
使用布隆过滤器的计算方法,将所述文字图像中的内容与redis服务中的关键字进行进行一一比对。
优选的,所述对字符单元集合进行逐个截取得到文字图像,包括:
使用大津算法对文字图像进行阈化;
对阈化结果进行画布拉伸;
然后进行图像形态处理,以得到正常、纤细和加粗三种形态的文字图像;
将三种形态的文字图像送入Tesseract模块进行识别;
根据识别结果择优选取其中一种识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市赤狐软件技术有限公司,未经深圳市赤狐软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010123374.8/2.html,转载请声明来源钻瓜专利网。