[发明专利]一种图像识别方法、装置和电子设备在审
| 申请号: | 201810574220.3 | 申请日: | 2018-06-06 |
| 公开(公告)号: | CN110569835A | 公开(公告)日: | 2019-12-13 |
| 发明(设计)人: | 徐露露 | 申请(专利权)人: | 北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
| 代理公司: | 11319 北京润泽恒知识产权代理有限公司 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 原始图像 文本检测 特征图像 卷积神经网络 文本信息 像素分割 连通域 像素点坐标 电子设备 高效识别 区域确定 图像处理 图像识别 文本 图像 | ||
本发明实施例提供了一种图像识别方法、装置和电子设备,其中,所述方法包括:获取原始图像,采用全卷积神经网络提取所述原始图像的特征得到特征图像,确定所述特征图像的连通域,依据连通域的像素点坐标确定原始图像的文本检测区域,依据所述文本检测区域确定文本信息,并显示所述文本信息;进而本发明实施例通过采用全卷积神经网络对原始图像进行像素分割,以及对像素分割得到的特征图像进行图像处理,来确定原始图像的文本检测区域,提高了确定文本检测区域的准确性和效率,从而能够高效识别图像中各种角度的文本。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种图像识别方法、装置和电子设备。
背景技术
如今,很多场景都需要进行图像识别,比如交通监控系统拍摄到车辆闯红灯后,需要对拍摄图像进行识别确定车辆的车牌号;又比如用户下载的很多资料可能是图片格式的,则需要将图片转换成文档;还比如拍照翻译等等。
其中,很多图像中的文本很可能不是水平的,如图1所示,图1中“PASSPORT”和“PASSPO”都是倾斜的;目前对图像中非水平方向的文本没有高效的识别方案,例如,基于候选框区域的方法只能较为准确的提取水平方向的文字,又例如基于像素分割的方法后处理操作非常耗时。
发明内容
本发明实施例提供一种图像识别方法,以高效识别图像中各种角度的文本。
相应的,本发明实施例还提供了一种图像识别装置和一种电子设备,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种图像识别方法,具体包括:获取原始图像,采用全卷积神经网络提取所述原始图像的特征得到特征图像;确定所述特征图像的连通域,依据连通域的像素点坐标确定原始图像的文本检测区域;依据所述文本检测区域确定文本信息,并显示所述文本信息。
可选地,所述确定所述特征图像的连通域,包括:对所述特征图像进行二值化处理,得到二值化特征图像;对所述二值化特征图像进行连通域分析,确定所述特征图像的连通域;其中,一行文本对应一个连通域。
可选地,所述依据连通域的像素点坐标确定原始图像的文本检测区域,包括:依据所述连通域的像素点坐标,确定所述连通域的外接多边形和外接多边形各个顶点的像素点坐标;依据所述各个顶点的像素点坐标,确定所述原始图像的文本检测区域。
可选地,所述依据所述各个顶点的像素点坐标,确定所述原始图像的文本检测区域,包括:依据所述各个顶点的像素点坐标,确定所述原始图像中各顶点对应的像素点;确定以所述各个像素点为顶点的多边形区域,将所述多边形区域确定为所述原始图像的文本检测区域。
可选地,所述依据所述各个顶点的像素点坐标,确定所述原始图像中的各顶点对应的像素点,包括:依据设定条件更新各个顶点的像素点坐标,以放大由所述顶点组成的多边形面积;在原始图像中分别确定更新像素点坐标后各顶点对应的像素点。
可选地,所述外接多边形包括所述连通域的最小面积外接四边形。
可选地,还包括训练全卷积神经网络的步骤:获取训练图像;将所述训练图像输入至全卷积神经网络中,得到最后一个卷积层输出的特征图像;确定所述训练图像对应的标签图像,对所述最后一个卷积层输出的特征图像与标签图像进行误差计算;依据所述误差计算的结果调整所述全卷积神经网络的权值。
可选地,所述确定所述训练图像对应的标签图像,包括:确定所述训练图像中各文本行对应文本框的像素点坐标;依据所述训练图像和文本框的像素点坐标,生成具有标注区域的标签图像,其中,所述标注区域不大于所述文本框的像素点坐标构成的区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司,未经北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810574220.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于生产线监测的图像采集装置
- 下一篇:一种可变长字符串识别方法与装置





