[发明专利]文字图像标注方法、装置及计算机可读存储介质在审
申请号: | 201811309895.1 | 申请日: | 2018-11-06 |
公开(公告)号: | CN109685059A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 肖玉宾;喻红 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/68 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 原始文字 单字识别 文字识别 图像 行切 标注 单字图像 计算机可读存储介质 切割 文字图像 纠偏 图像识别技术 单字 保存 记录 | ||
本发明涉及图像识别技术,揭露了一种文字图像标注方法、装置及计算机可读存储介质,该方法包括:接收原始文字图像;对原始文字图像进行纠偏;对纠偏后的原始文字图像进行行切;通过OCR系统对行切后的原始文字图像进行行文字识别,并保存行文字识别结果;对行切后的原始文字图像进行单字切割,并记录切割得到的每个单字图像在行中的先后顺序;将切割得到的每个单字图像通过OCR系统进行单字识别,并保存单字识别结果;将行文字识别结果与行中所有的单字识别结果进行对比,当判断行文字识别结果与行中所有的单字识别结果相同时,根据行文字识别结果对对应的行切后的原始文字图像进行标注,根据单字识别结果对对应的单字图像进行标注。
技术领域
本发明涉及图像识别领域,尤其涉及一种文字图像标注方法、装置及计算机可读存储介质。
背景技术
目前很多在深度学习神经网络文字识别的训练的过程中,需要大量的标注数据,目前大部分图像数据都是由人工进行数据标注,人工标注的数据费用较高,且耗费时间较长,标注的数据准确性也不高。
发明内容
本发明提供一种文字图像标注方法、装置及计算机可读存储介质,其主要目的在于提高图片标注的准确性。
为实现上述目的,本发明提供一种文字图像标注方法,应用于文字图像标注装置中,所述文字图像标注方法包括:
对接收的原始文字图像进行纠偏;
对纠偏后的原始文字图像进行行切;
通过OCR系统对行切后的原始文字图像进行行文字识别,并保存行文字识别结果;
对所述行切后的原始文字图像进行单字切割,并记录切割得到的每个单字图像在行中的先后顺序;
通过所述OCR系统对切割得到的每个单字图像进行单字识别,并保存单字识别结果;
将所述行文字识别结果与行中所有文字的单字识别结果进行对比,当判断所述行文字识别结果与所述行中所有文字的单字识别结果相同时,根据所述行文字识别结果对对应的行切后的原始文字图像进行标注,根据所述单字识别结果对对应的单字图像进行标注。
可选地,所述对接收的原始文字图像进行纠偏的步骤包括:
根据用户在所述原始文字图像的同一边缘处选取的至少两个校准点获取所述校准点的坐标;
根据所述坐标计算所述原始文字图像的倾斜角的角度;
根据所述倾斜角的角度对所述原始文字图像执行旋转校正。
可选地,所述对纠偏后的原始文字图像进行行切的步骤包括:
获取所述纠偏后的原始文字图像中文字区域的每个连通域的重心坐标,生成坐标集合;
连接所述坐标集合中同一行中第a个重心坐标和第a+1个重心坐标而得到行连通域,其中所述a为自然数;
根据所述行连通域获得所述行连通域的轮廓曲线;
根据所述轮廓曲线将所述纠偏后的原始文字图像中对应的像素映射至空白图像中得到行切后的原始文字图像。
可选地,所述对所述行切后的原始文字图像进行单字切割的步骤是通过利用字与字之间的空白间隙在所述行切后的原始文字图像行的垂直投影上形成的空白间隔将单字图像切分出来。
可选地,当判断所述行文字识别结果与所述行中所有的单字识别结果不同时,将所述行切后的原始文字图像及所述切割得到的每个单字图像通过所述OCR系统进行再次识别。
本发明还提供一种文字图像标注装置,所述文字图像标注装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的文字图像标注程序,所述文字图像标注程序被所述处理器执行时实现如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811309895.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像目标识别方法、装置及计算机设备
- 下一篇:图像处理方法和装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序