[发明专利]图像文字识别方法、系统、电子设备及存储介质有效
申请号: | 202110717796.2 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113435331B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 邱程 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06N3/0464;G06V10/82;G06T7/11;G06T7/13;G06T7/136 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 文字 识别 方法 系统 电子设备 存储 介质 | ||
1.一种图像文字识别方法,其特征在于,包括:
对目标图像进行轮廓检测,得到第一位置坐标集,所述第一位置坐标集用于表征所述目标图像的轮廓信息;
对所述目标图像进行特征提取,得到多个特征集,所述特征集用于表征所述目标图像中的格式信息及语义信息;
对多个图像切片进行区域框划分,并对每个区域框进行编号,一个所述区域框内包括至少一个所述图像切片;
将所述第一位置坐标集、特征集及编号输入至预设的识别模型,获取所述目标图像的识别结果;
其中,所述对目标图像进行轮廓检测,得到第一位置坐标集,所述第一位置坐标集用于表征所述目标图像的轮廓信息,还包括:
对所述目标图像进行二值化处理,得到二值化图像;
对所述二值化图像进行横向线检测,得到多个点坐标;
根据多个所述点坐标生成所述第一位置坐标集;
其中,所述对所述二值化图像进行横向线检测,得到多个点坐标,还包括:
采用形状为n*1的卷积核矩阵对所述二值化图像进行膨胀和腐蚀处理,以消除非横向线条像素,得到横向线条上的多个点坐标;其中,n用于表征行,1用于表征列;
其中,所述对所述目标图像进行特征提取,得到多个特征集,所述特征集用于表征所述目标图像中的格式信息及语义信息,还包括:
对所述目标图像进行分割,得到多个图像切片,且每个所述图像切片内包含至少一个字符;
对每个所述图像切片整体进行像素识别,得到所述图像切片内包含的字符的像素特征;
对每个所述图像切片内包含的字符进行语义识别,得到对应的语义特征;
根据所述像素特征和语义特征生成对应的所述特征集;
其中,所述对每个所述图像切片整体进行像素识别,得到所述图像切片内包含的字符的像素特征,还包括:
将每个所述图像切片输入CNN模型;
利用CNN模型中的卷积层对所述图像切片进行卷积特征提取,得到初始特征;
利用所述CNN模型中的池化层对所述初始特征进行降维,得到降维特征;
利用CNN模型中的全连接层输出所述降维特征,得到像素特征;
其中,所述对多个所述图像切片进行区域框划分,并对每个区域框进行编号,一个所述区域框内包括至少一个所述图像切片,还包括:
根据所述区域框所覆盖面积以及所述区域框内包含的全部所述图像切片所覆盖的面积,得到所述区域框的密度及密度阈值,所述密度阈值用于表征所述区域框内包含所述目标图像中全部的图像切片时的密度;
当所述区域框的密度小于所述密度阈值时,对所述区域框进行重新划分;
当所述区域框的密度大于所述密度阈值,且所述区域框达到所述目标图像的边界时,对所述区域框进行划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110717796.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序