[发明专利]模型训练方法、字符识别方法、装置、设备及存储介质在审
| 申请号: | 202010260100.3 | 申请日: | 2020-04-03 |
| 公开(公告)号: | CN111461238A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 韩涛;李梓赫;谭昶 | 申请(专利权)人: | 讯飞智元信息科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
| 地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 字符 识别 装置 设备 存储 介质 | ||
本申请实施例公开了一种模型训练方法、字符识别方法、装置、设备及存储介质,通过至少部分网络层输出的特征图的辨识度越高时,迁移网络层输出的特征图越趋近于上述至少部分网络层输出的特征图,使得目标字符识别模型能够学习初始字符识别模型中好的特征提取行为,而对于初始字符识别模型中不好的特征提取行为,则进行更新迭代,结合训练目标字符识别模型的样本是从大数据集中挑选出来的字符出现频率相对均匀的样本,使得目标字符识别模型朝各个样本方向收敛,而不是朝高频字方向收敛,克服了现有技术容易将偏僻字识别成常见字的问题。
技术领域
本申请涉及信息处理技术领域,更具体地说,涉及一种模型训练方法、字符识别方法、装置、设备及存储介质。
背景技术
光学字符识别(Optical Character Recognition,简称OCR)是计算机视觉的子方向,目标是从图像数据中识别出文字,并保存为计算机文本数据。
目前,较常用的字符识别方法是利用神经网络模型进行字符识别,然而,目前的神经网络模型在进行字符识别时易出现将偏僻字被识别成常见字的情况。
发明内容
有鉴于此,本申请提供了一种模型训练方法、字符识别方法、装置、设备及存储介质,以克服现有技术容易将偏僻字识别成常见字的问题。
为了实现上述目的,现提出的方案如下:
一种字符识别模型训练方法,包括:
利用目标字符识别模型对目标图像样本进行处理,得到所述目标图像样本对应的第一字符识别结果;所述目标字符识别模型至少包括由初始字符识别模型的部分或全部网络层组成的迁移网络层,所述初始字符识别模型通过初始图像样本集训练得到,所述目标图像样本为所述初始图像样本集中字符出现频率满足预设均匀分布条件的图像样本;
根据由第一目标和第二目标构成的训练目标对所述目标字符识别模型的参数进行更新;其中,所述第一目标为所述第一字符识别结果趋近于所述目标图像样本对应的字符标签,所述第二目标为所述部分或全部网络层在所述初始字符识别模型处理所述目标图像样本时输出的特征图对所述初始字符识别模型输出的第二字符识别结果的影响越大,所述迁移网络层输出的特征图越趋近于所述部分或全部网络层输出的特征图。
上述方法,优选的,所述根据由第一目标和第二目标构成的训练目标对所述目标字符识别模型的参数进行更新,包括:
根据所述目标字符识别模型的正则化损失函数,对所述目标字符识别模型的参数进行更新,以实现所述第一目标和所述第二目标;
其中,所述正则化损失函数的误差部分为所述第一字符识别结果与所述目标图像样本对应的字符标签的差异,所述正则化损失函数的正则化部分至少包括由所述迁移网络层与所述部分或全部网络层中的对应特征图的差异的加权和构成的第一正则项;其中,每一个差异的权重表征所述部分或全部网络层输出的与所述目标图像样本对应的特征图对所述第二字符识别结果的影响程度。
上述方法,优选的,所述第一正则项通过如下方式获得:
对应所述迁移网络层中的至少部分迁移网络层中的每一个特征提取模块,计算该特征提取模块基于所述目标图像样本输出的特征图与目标网络层中与该特征提取模块对应的目标特征提取模块基于所述目标图像样本输出的特征图之间的距离;其中,所述目标网络层为所述初始字符识别模型中与所述至少部分迁移网络层对应的网络层;
计算该特征提取模块基于所述目标图像样本输出的特征图与所述目标特征提取模块基于所述目标图像样本输出的特征图的距离的权重;
利用各个距离的权重,将所述至少部分迁移网络层中的各个特征提取模块基于所述目标图像样本输出的特征图对应的距离加权求和,得到与所述目标图像样本对应的第一正则项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司,未经讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010260100.3/2.html,转载请声明来源钻瓜专利网。





