[发明专利]报关单图像中文字定位与提取的方法在审
申请号: | 201910339146.1 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110210297A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 刘晋;杨一何;田小琥;栾翠菊 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/38;G06K9/40;G06N3/04 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 霍夫变换 文本信息 中文字 分块 可编辑文件 图像二值化 分块图像 投影计算 网络识别 网络训练 区域块 导出 汉字 英文 图片 | ||
本发明公开了一种报关单图像中文字定位与提取的方法,其中,对待识别图片进行图像二值化;使用霍夫变换获取直线,对图像进行分块;对需要识别的分块进行投影计算,获取分块图像中的文本信息;将文本信息导入识别网络识别;导出识别结果。本发明对图像进行处理后,通过霍夫变换寻找直线,从而可以根据设定将所需要的区域块提取出来。利用VGG网络训练汉字与英文的识别,识别结果输入到一张excel表格中,生成可编辑文件。
技术领域
本发明涉及一种文字提取方法,尤其涉及一种报关单图像中文字定位与提取的方法。
背景技术
报关是指进出口货物收发货人、进出境运输工具负责人、进出境物品所有人或者他们的代理人向海关办理货物、物品或运输工具进出境手续及相关海关事务的过程,包括向海关申报、填写报关单和交验单据证件,并接受海关的监管和检查等。
但是,现有的海关报关单通常都是由企业内部的人员逐一将货物的各种资料信息通过人工整理得出,期间需要核对各种数据,工作量大,出错率高。
本发明自动化定位报关单中相关信息的位置,快速的对相关区域的信息定位和识别,从而高效地实现报关的流程。
发明内容
本发明的上述目的是通过以下技术方案实现的:
一种报关单图像中文字定位与提取的方法,其中,对待识别图片进行图像二值化;使用霍夫变换获取直线,对图像进行分块;对需要识别的分块进行投影计算,获取分块图像中的文本信息;将文本信息导入识别网络识别;导出识别结果。
如上所述的报关单图像中文字定位与提取的方法,其中,将文本信息导入识别网络后进行VGG网络训练。
如上所述的报关单图像中文字定位与提取的方法,其中,将表单转换成图片格式后,对待识别图片进行图像降噪和二值化。
如上所述的报关单图像中文字定位与提取的方法,其中,将表单转换成图片格式,对歪斜图片检测并纠正。
如上所述的报关单图像中文字定位与提取的方法,其中,对待识别图片进行图像降噪包括:使用NLM进行降噪。
如上所述的报关单图像中文字定位与提取的方法,其中,对图像进行分块后去除手写字,去除手写字包括:统计分块内的像素个数,与设定阈值对比,如果不在设定阈值范围内,则判断为手写。
如上所述的报关单图像中文字定位与提取的方法,其中,进行投影计算获取分块图像中的文本信息包括:通过水平投影法切出数字、字母、汉字。
如上所述的报关单图像中文字定位与提取的方法,其中,VGG网络训练包括:VGG整个网络都使用了同样大小的3*3卷积核尺寸和2*2最大池化尺寸;采用了Multi-Scale(Multi-Scale多尺度)的方法来训练和预测。
如上所述的报关单图像中文字定位与提取的方法,其中,将文本信息导入识别网络识别包括:对汉字进行识别、对英文和数字进行识别;对汉字进行识别包括:将汉字字库中的文字写入到文本文件中,并在同目录文件下成汉字字库文件;把汉字字库中的字一个个保存成图片;在卷积神经网络内进行文字识别,卷积神经网络包括:输入层接收二值化图像,经过两个卷积层、池化层、dropout层、两个卷积层、池化层、dropout层、全连接层、sofmax层后输出。
如上所述的报关单图像中文字定位与提取的方法,其中,导出识别结果包括:识别结果输入到一张excel表格中,生成可编辑文件。
综上所述,由于采用了上述技术方案,本发明对图像进行处理后,通过霍夫变换寻找直线,从而可以根据设定将所需要的区域块提取出来。利用VGG网络训练汉字与英文的识别,识别结果输入到一张excel表格中,生成可编辑文件。
附图说明
图1是本发明报关单图像中文字定位与提取的方法的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910339146.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序