[发明专利]一种字符识别模型训练方法、装置及系统在审

专利信息
申请号: 202110385919.7 申请日: 2021-04-09
公开(公告)号: CN113052176A 公开(公告)日: 2021-06-29
发明(设计)人: 王改 申请(专利权)人: 平安国际智慧城市科技股份有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强
地址: 518000 广东省深圳市前海深港合*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 字符 识别 模型 训练 方法 装置 系统
【说明书】:

本申请实施例适用于图像处理领域中的OCR识别,公开了一种字符识别模型训练方法、装置及系统,该方法包括:对样本图像进行第一卷积特征的提取得到第一特征矩阵,第一特征矩阵指示用于区分字符像素和空白处像素的目标特征;根据第一特征矩阵识别字符像素和空白处像素;对像素进行特征加强处理得到第二特征矩阵,以使第一差异度小于第二差异度,第一差异度是第一特征矩阵所指示的字符像素和空白处像素各自的目标特征之间的差异度,第二差异度是第二特征矩阵所指示的字符像素和空白处像素各自的目标特征之间的差异度;根据第二特征矩阵确定字符预测结果;根据字符预测结果以及标注标签,调节模型参数。本申请可以提高字符识别模型的泛化能力。

技术领域

本申请涉及机器学习领域,尤其涉及一种字符识别模型训练方法、装置及系统。

背景技术

OCR(optical character recognition,光学字符识别)技术可以把图像中的字符进行识别,并以文本的形式返回,其在多种不同的场景都有着广泛的应用,如证件识别场景、车牌识别场景、快递地址识别填写场景、票据识别场景等等。通常,光学字符识别技术可以包含两个步骤,首先对图像进行处理,获取图片信息,进而根据图片信息输出其中包含的字符。CRNN(convolution recurrent neural network,卷积循环神经网络)就是一种可以进行光学字符识别的神经网络,CRNN网络包括卷积层、循环层和转录层,卷积层可以通过多个卷积核提取图像的多种抽象特征,循环层可以对图像的特征进行序列化学习,学习图像中字符的上下文特征,并输出针对图片的预测结果,转录层可以将针对图片的预测转换为最终的标签序列结果。目前这种CRNN网络由于对图像特征的提取等处理方式较为固定单一,字符识别的泛化能力不佳。

发明内容

本申请提供一种字符识别模型训练方法、装置及系统,通过本申请可以提高模型特征学习的有效性,从而提高字符识别模型的预测准确性和泛化能力。

本发明实施例第一方面提供了一种字符识别模型训练方法,包括:

对样本图像进行第一卷积特征的提取,得到第一特征矩阵,所述第一特征矩阵指示用于区分所述样本图像中字符像素和空白处像素的目标特征;

根据所述第一特征矩阵识别所述样本图像中的字符像素和空白处像素;

对所述样本图像中的像素进行特征加强处理,得到第二特征矩阵,以使第一差异度小于第二差异度,所述第一差异度是所述第一特征矩阵所指示的所述样本图像中字符像素和空白处像素各自的所述目标特征之间的差异度,所述第二差异度是所述第二特征矩阵所指示的所述样本图像中字符像素和空白处像素各自的所述目标特征之间的差异度;

根据所述第二特征矩阵确定所述样本图像的字符预测结果;

根据所述样本图像的字符预测结果以及所述样本图像的标注标签,调节所述字符识别模型的模型参数。

结合第一方面,在第一种可能的实现方式中,所述目标特征包括所述字符像素对应的第一特征状态和所述空白处像素对应的第二特征状态;

所述对所述样本图像中的像素进行特征加强处理包括:

针对所述字符像素的目标特征进行所述第一特征状态的加强处理,和/或,针对所述空白处像素的目标特征进行所述第二特征状态的加强处理。

结合第一方面,在第二种可能的实现方式中,所述样本图像的标注标签包括所述样本图像中字符对应的字符标签和所述样本图像中空白处对应的空白处标签。

结合第一方面,在第三种可能的实现方式中,所述根据所述第二特征矩阵确定所述样本图像的字符预测结果包括:

对多个第一特征向量进行上下文特征融合,得到所述多个第一特征向量各自对应的第二特征向量,所述多个第一特征向量时候根据所述第二特征矩阵确定的;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110385919.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top