[发明专利]一种图像识别方法、装置和电子设备在审
| 申请号: | 201810574220.3 | 申请日: | 2018-06-06 |
| 公开(公告)号: | CN110569835A | 公开(公告)日: | 2019-12-13 |
| 发明(设计)人: | 徐露露 | 申请(专利权)人: | 北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
| 代理公司: | 11319 北京润泽恒知识产权代理有限公司 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 原始图像 文本检测 特征图像 卷积神经网络 文本信息 像素分割 连通域 像素点坐标 电子设备 高效识别 区域确定 图像处理 图像识别 文本 图像 | ||
1.一种图像识别方法,其特征在于,包括:
获取原始图像,采用全卷积神经网络提取所述原始图像的特征得到特征图像;
确定所述特征图像的连通域,依据连通域的像素点坐标确定原始图像的文本检测区域;
依据所述文本检测区域确定文本信息,并显示所述文本信息。
2.根据权利要求1所述的方法,其特征在于,所述确定所述特征图像的连通域,包括:
对所述特征图像进行二值化处理,得到二值化特征图像;
对所述二值化特征图像进行连通域分析,确定所述特征图像的连通域;
其中,一行文本对应一个连通域。
3.根据权利要求1所述的方法,其特征在于,所述依据连通域的像素点坐标确定原始图像的文本检测区域,包括:
依据所述连通域的像素点坐标,确定所述连通域的外接多边形和外接多边形各个顶点的像素点坐标;
依据所述各个顶点的像素点坐标,确定所述原始图像的文本检测区域。
4.根据权利要求3所述的方法,其特征在于,所述依据所述各个顶点的像素点坐标,确定所述原始图像的文本检测区域,包括:
依据所述各个顶点的像素点坐标,确定所述原始图像中各顶点对应的像素点;
确定以所述各个像素点为顶点的多边形区域,将所述多边形区域确定为所述原始图像的文本检测区域。
5.根据权利要求4所述的方法,其特征在于,所述依据所述各个顶点的像素点坐标,确定所述原始图像中的各顶点对应的像素点,包括:
依据设定条件更新各个顶点的像素点坐标,以放大由所述顶点组成的多边形面积;
在原始图像中分别确定更新像素点坐标后各顶点对应的像素点。
6.根据权利要求3-5任一所述的方法,其特征在于,所述外接多边形包括所述连通域的最小面积外接四边形。
7.根据权利要求1所述的方法,其特征在于,还包括训练全卷积神经网络的步骤:
获取训练图像;
将所述训练图像输入至全卷积神经网络中,得到最后一个卷积层输出的特征图像;
确定所述训练图像对应的标签图像,对所述最后一个卷积层输出的特征图像与标签图像进行误差计算;
依据所述误差计算的结果调整所述全卷积神经网络的权值。
8.一种图像识别装置,其特征在于,包括:
特征提取模块,用于获取原始图像,采用全卷积神经网络提取所述原始图像的特征得到特征图像;
区域确定模块,用于确定所述特征图像的连通域,依据连通域的像素点坐标确定原始图像的文本检测区域;
文本显示模块,用于依据所述文本检测区域确定文本信息,并显示所述文本信息。
9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7任一所述的图像识别方法。
10.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取原始图像,采用全卷积神经网络提取所述原始图像的特征得到特征图像;
确定所述特征图像的连通域,依据连通域的像素点坐标确定原始图像的文本检测区域;
依据所述文本检测区域确定文本信息,并显示所述文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司,未经北京搜狗科技发展有限公司;搜狗(杭州)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810574220.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于生产线监测的图像采集装置
- 下一篇:一种可变长字符串识别方法与装置





