[发明专利]图像识别的方法及装置有效
申请号: | 201910831740.2 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110674811B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 刘学文 | 申请(专利权)人: | 广东浪潮大数据研究有限公司 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/148;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李慧引 |
地址: | 510620 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 | ||
本发明提供了一种图像识别的方法及装置,该方法包括:通过获取待识别图像;其中,所述待识别图像显示有一行待识别文本;利用目标检测算法模型对所述待识别图像进行处理,得到组成所述待识别文本的每一个文字的位置信息;根据所述待识别文本的每一个文字的位置信息对所述待识别图像进行分割,得到多个子图像;其中,每个所述子图像均显示有一个所述文字;利用文字识别‑卷积神经网络模型对所述每一个所述子图像进行处理,识别出每一个所述子图像中的文字;将识别得到的每一个文字按所述文字的位置信息排列,得到所述待识别图像的识别结果。达到提高对图中文字分割的精确度,从而提高文字识别的精确度的目的。
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像识别的方法及装置。
背景技术
图像中的文字识别在许多领域有着广泛的需求,相关应用涉及了身份证识别、车牌号识别、快递单识别、银行卡号识别等等。图像中的文字识别通常需要将每个文字从图像中分割下来,而传统的方法是先对图像中的文字进行水平分割,在对分割出来的每一行进行垂直投影,找到每一个文字的左右边界后,在进行单个文字的分割,再将分割后的字符图像利用设计好的模型进行文字识别。
然而,由于汉字之间可能排列的比较紧密以及汉字中存在很多左右偏旁结构的字,导致如果利用垂直投影后,再进行垂直切割时,很容易造成过度分割。从而导致后续利用设计好的模型进行文字识别的过程中,对文字识别的精确度不高。
发明内容
有鉴于此,本发明实施例提供一种图像识别的方法及装置,用于提高对图中文字分割的精确度,从而提高文字识别的精确度。
为实现上述目的,本发明实施例提供如下技术方案:
一种图像识别的方法,包括:
获取待识别图像;其中,所述待识别图像显示有一行待识别文本;
利用目标检测算法模型对所述待识别图像进行处理,得到组成所述待识别文本的每一个文字的位置信息;
根据所述待识别文本的每一个文字的位置信息对所述待识别图像进行分割,得到多个子图像;其中,每个所述子图像均显示有一个所述文字;
利用文字识别-卷积神经网络模型对所述每一个所述子图像进行处理,识别出每一个所述子图像中的文字;
将识别得到的每一个文字按所述文字的位置信息排列,得到所述待识别图像的识别结果。
可选的,所述利用目标检测算法模型对所述待识别图像进行处理,得到组成所述待识别文本的每一个文字的位置信息之前,还包括:
判断所述待识别图像显示的待识别文本是否为多行;
若判断出所述待识别图像显示的待识别文本为多行,则找到每一行的上界限和下界限,进行水平切割得到多个所述待识别子文本。
可选的,所述利用目标检测算法模型对所述待识别图像进行处理,得到组成所述待识别文本的每一个文字的位置信息,包括:
判断所述待识别文本的大小是否符合预设大小;
若判断出所述待识别文本的大小不符合所述预设大小,则将所述待识别文本的大小变更为所述预设大小;
记录在所述待识别文本变更为所述预设大小后,所述待识别文本中的每个汉字的位置(xmin,ymin,xmax,ymax);其中,(xmin,ymin)和(xmax,ymax)分别是所述汉字的左上角坐标和右下角坐标。
可选的,所述记录在所述待识别文本变更为所述预设大小后,所述待识别文本中的每个汉字的位置(xmin,ymin,xmax,ymax)之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东浪潮大数据研究有限公司,未经广东浪潮大数据研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910831740.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序