[发明专利]图像文字识别方法、系统、电子设备及存储介质有效
申请号: | 202110717796.2 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113435331B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 邱程 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06N3/0464;G06V10/82;G06T7/11;G06T7/13;G06T7/136 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 文字 识别 方法 系统 电子设备 存储 介质 | ||
本发明公开了一种图像文字识别方法、系统、电子设备及存储介质,包括:对目标图像进行轮廓检测,得到第一位置坐标集,所述第一位置坐标集表征所述目标图像的轮廓信息;对所述目标图像进行特征提取,得到多个特征集,所述特征集表征所述目标图像中的格式信息及语义信息;将所述第一位置坐标集及特征集输入至预设的识别模型,获取目标图像的识别结果。通过像素特征获取所述图像切片所包括文字对应的字体、大小、颜色等格式信息。通过语义特征获取所述图像切片所包括文字对应的在语言上所蕴含的意义。通过对所述目标图像进行轮廓检测,得到第一位置坐标集,以便于对折痕、倾斜、扭曲等情况的目标图像中的各种角度以及各种弯曲形状文字的抽取。
技术领域
本发明涉及图像处理的技术领域,尤其涉及一种图像文字识别方法、系统、电子设备及存储介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指将一幅图像中的文字信息识别出来的技术,通过光学设备捕捉图像进行检测并对文字进行识别,将视觉和识字能力延伸至机器上。OCR技术现已广泛地应用在医疗、保险、金融、物流、传统制造业等领域。例如,在保险业务的一种医疗保险理赔场景中,需识别用户使用手机拍摄上传的医疗票据中的文字,以实现理赔信息精准提取。
然而,由于照片图像可能会存在有折痕、阴影、倾斜、扭曲及板式复杂多样等情况,使用上述图像检测方式无法达到精准识别效果。例如,无法识别个别较为扭曲的文字或遗漏被阴影遮挡的文字,导致图像文字信息部分遗漏或无法识别。又例如,采用语义分割的图像检测方式,只会将同一类型的目标所在的整体区域划分出来,可能会导致较为紧密的多行文字无法有效地区分开,结果产生多行检测为一行的情况,影响后续识别过程,导致无法对图像上文字进行精准提取。
发明内容
本发明的目的是提供一种图像文字识别方法、系统、电子设备及存储介质,用于解决现有技术存在的问题。
为实现上述目的,本发明提供一种图像文字识别方法,包括:
对目标图像进行轮廓检测,得到第一位置坐标集,所述第一位置坐标集用于表征所述目标图像的轮廓信息;
对所述目标图像进行特征提取,得到多个特征集,所述特征集用于表征所述目标图像中的格式信息及语义信息;
对多个所述图像切片进行区域框划分,并对每个区域框进行编号,一个所述区域框内包括至少一个所述图像切片;
将所述第一位置坐标集、特征集及编号输入至预设的识别模型,获取所述目标图像的识别结果。
优选地,所述对目标图像进行轮廓检测,得到第一位置坐标集,所述第一位置坐标集用于表征所述目标图像的轮廓信息,还包括:
对所述目标图像进行二值化处理,得到二值化图像;
对所述二值化图像进行横向线检测,得到多个点坐标;
根据多个所述点坐标生成所述第一位置坐标集。
优选地,所述对所述二值化图像进行横向线检测,得到多个点坐标,还包括:
采用形状为n*1的卷积核矩阵对所述二值化图像进行膨胀和腐蚀处理,以消除非横向线条像素,得到横向线条上的多个点坐标;其中,n用于表征行,1用于表征列。
优选地,所述对所述目标图像进行特征提取,得到多个特征集,所述特征集用于表征所述目标图像中的格式信息及语义信息,还包括:
对所述目标图像进行分割,得到多个图像切片,且每个所述图像切片内包含至少一个字符;
对每个所述图像切片整体进行像素识别,得到所述图像切片内包含的字符的像素特征;
对每个所述图像切片内包含的字符进行语义识别,得到对应的语义特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110717796.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序