[发明专利]一种文本识别模型的构建及文本识别方法和装置在审
| 申请号: | 202010966835.8 | 申请日: | 2020-09-15 |
| 公开(公告)号: | CN112183525A | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 高远 | 申请(专利权)人: | 中保车服科技服务股份有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06N3/04;G06N3/08 |
| 代理公司: | 深圳中细软知识产权代理有限公司 44528 | 代理人: | 孙凯乐 |
| 地址: | 518028 广东省深圳市福田区华富街道莲*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 识别 模型 构建 方法 装置 | ||
本发明实施例公开了一种文本识别模型的构建及文本识别方法和装置,其中该构建方法包括:获取待识别的目标文本行图像,所述目标文本行图像上只保留文本数据;将所述目标文本行图像对初始神经网络进行训练,并判断使用所述目标文本行图像对所述初始神经网络的训练是否已经达到预定目标;若是,则记录并保存此时的所述初始神经网络对应的网络结构与模型参数数值,将其作为所述文本识别模型对应的网络结构与模型参数数值。本发明解决了现有技术的以下问题:传统文本识别模型只有一个解码器,由该解码器来统一识别这两类以上的文本行时,差别较大的文本行将使得解码器难以拟合,并且会抛弃有助于解码器进行解码的文本行类别信息。
技术领域
本发明涉及文本识别技术领域,尤其涉及一种文本识别模型的构建及文本识别方法和装置。
背景技术
目前,在使用OCR(Optical Character Recognition,光学字符识别)技术做文本识别时,流程大致如下:首先使用文本检测模型检测出文本行所在的位置,然后根据文本行位置扣出文本行图像,最后使用文本识别模型对文本行图像中的文字信息进行识别。在识别具有固定排版格式的证件时,例如需要识别身份证上的身份证号码与住址信息,此时这两种文本行可看作两种类别的文本行,它们具有各自的特色信息。身份证号码文本行由固定长度的数字信息构成,而住址信息文本行通常为一个常文本且基本由汉字构成。基于Endoder-Decoder(编解码器)的传统文本识别模型只有一个解码器,由该解码器来统一识别这两类文本行,这样会带来两个问题:首先,多种差别较大的文本行将使得解码器难以拟合;另外,用同一个解码器识别多种文本行,抛弃了文本行类别信息,而文本行类别信息是有助于解码器去解码对应文本行的文字信息的。综上所述,传统文本识别模型只有一个解码器所带来的问题,亟待解决。
发明内容
基于此,有必要针对上述问题,提出一种文本识别模型的构建及文本识别方法和装置,以解决现有技术的以下问题:传统文本识别模型只有一个解码器,由该解码器来统一识别这两类以上的文本行时,差别较大的文本行将使得解码器难以拟合,并且会抛弃有助于解码器进行解码的文本行类别信息。
本发明实施例的第一技术方案为:
一种文本识别模型的构建方法,其包括:获取待识别的目标文本行图像,所述目标文本行图像上只保留文本数据;将所述目标文本行图像对初始神经网络进行训练,并判断使用所述目标文本行图像对所述初始神经网络的训练是否已经达到预定目标;若使用所述目标文本行图像对所述初始神经网络的训练已经达到预定目标,则记录并保存此时的所述初始神经网络对应的网络结构与模型参数数值,将其作为所述文本识别模型对应的网络结构与模型参数数值。
本发明实施例的第二技术方案为:
一种文本识别方法,其基于权利要求上述任一项所述的文本识别模型的构建方法所构建的文本识别模型来实现,其包括以下步骤:接收待识别的目标文本行图像输出为目标文本预测结果的目标处理信号,并对所述待识别的所述目标文本行图像进行预处理,得到所述目标文本行特征图;读取预先保存的所述文本识别模型的网络结构与模型参数数值,以恢复生成可将输入其中的所述目标文本行特征图输出为所述目标文本预测结果的目标输出网络;将得到所述目标文本行特征图输入所述目标输出网络进行处理,得到所述目标文本预测结果。
本发明实施例的第三技术方案为:
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取待识别的目标文本行图像,所述目标文本行图像上只保留文本数据;将所述目标文本行图像对初始神经网络进行训练,并判断使用所述目标文本行图像对所述初始神经网络的训练是否已经达到预定目标;若使用所述目标文本行图像对所述初始神经网络的训练已经达到预定目标,则记录并保存此时的所述初始神经网络对应的网络结构与模型参数数值,将其作为所述文本识别模型对应的网络结构与模型参数数值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中保车服科技服务股份有限公司,未经中保车服科技服务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010966835.8/2.html,转载请声明来源钻瓜专利网。





