[发明专利]一种识别模型的训练方法及训练装置在审

申请号：	202210037227.8	申请日：	2022-01-13
公开（公告）号：	CN114429575A	公开（公告）日：	2022-05-03
发明（设计）人：	姜仟艺;宋祺;魏晓明	申请（专利权）人：	北京三快在线科技有限公司
主分类号：	G06V10/774	分类号：	G06V10/774;G06V30/148;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京曼威知识产权代理有限公司 11709	代理人：	邓超
地址：	100080 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种识别模型训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书公开了一种识别模型的训练方法及训练装置，该识别模型的训练方法包括：获取各样本图像，所述各样本图像中包含有文字信息，将所述各样本图像输入到识别模型中，确定所述各样本图像中包含的各字符对应的字符特征图，通过所述识别模型将所述各字符对应的字符特征图投影到高维空间中，确定所述各字符对应的字符特征图在所述高维空间中的字符特征表示，以不同形态的相同字符的字符特征表示靠近同一特征中心，不同特征中心在所述高维空间中的距离越远为优化目标，调整不同特征中心在所述高维空间中的位置，以对所述识别模型进行训练，其中，所述高维空间的不同特征中心对应不同的字符。

技术领域

本说明书涉及文字识别技术领域，尤其涉及一种识别模型的训练方法及训练装置

背景技术

随着科技的发展，文字识别技术已经被应用到诸如远程身份认证、财税报销、内容审核以及文档电子化等各个场景当中，在缩减人力成本的同时，也为用户的工作生活提供了极大的便利，在文字识别的过程中，识别模型的准确性往往对文字识别的结果起着至关重要的作用。

然而，如果采用有监督学习的方式对识别模型进行训练，若想达到训练效果就需要消耗大量的人工成本及时间来对样本数据进行标注，而若是采用其他的训练方法，则无法对无标签训练样本达到充分的利用，而且限制了识别模型准确率。

因此，如何在减小模型训练的人工成本和时间的同时，提高识别模型的准确率，是一个亟待解决的问题。

发明内容

本说明书提供一种识别模型的训练方法及训练装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种识别模型的训练方法，包括：

获取各样本图像，所述各样本图像中包含有文字信息；

将所述各样本图像输入到识别模型中，确定所述各样本图像中包含的各字符对应的字符特征图；