[发明专利]一种识别模型的训练方法及训练装置在审
| 申请号: | 202210037227.8 | 申请日: | 2022-01-13 |
| 公开(公告)号: | CN114429575A | 公开(公告)日: | 2022-05-03 |
| 发明(设计)人: | 姜仟艺;宋祺;魏晓明 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V30/148;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 邓超 |
| 地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 识别 模型 训练 方法 装置 | ||
本说明书公开了一种识别模型的训练方法及训练装置,该识别模型的训练方法包括:获取各样本图像,所述各样本图像中包含有文字信息,将所述各样本图像输入到识别模型中,确定所述各样本图像中包含的各字符对应的字符特征图,通过所述识别模型将所述各字符对应的字符特征图投影到高维空间中,确定所述各字符对应的字符特征图在所述高维空间中的字符特征表示,以不同形态的相同字符的字符特征表示靠近同一特征中心,不同特征中心在所述高维空间中的距离越远为优化目标,调整不同特征中心在所述高维空间中的位置,以对所述识别模型进行训练,其中,所述高维空间的不同特征中心对应不同的字符。
技术领域
本说明书涉及文字识别技术领域,尤其涉及一种识别模型的训练方法及训练装置
背景技术
随着科技的发展,文字识别技术已经被应用到诸如远程身份认证、财税报销、内容审核以及文档电子化等各个场景当中,在缩减人力成本的同时,也为用户的工作生活提供了极大的便利,在文字识别的过程中,识别模型的准确性往往对文字识别的结果起着至关重要的作用。
然而,如果采用有监督学习的方式对识别模型进行训练,若想达到训练效果就需要消耗大量的人工成本及时间来对样本数据进行标注,而若是采用其他的训练方法,则无法对无标签训练样本达到充分的利用,而且限制了识别模型准确率。
因此,如何在减小模型训练的人工成本和时间的同时,提高识别模型的准确率,是一个亟待解决的问题。
发明内容
本说明书提供一种识别模型的训练方法及训练装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种识别模型的训练方法,包括:
获取各样本图像,所述各样本图像中包含有文字信息;
将所述各样本图像输入到识别模型中,确定所述各样本图像中包含的各字符对应的字符特征图;
通过所述识别模型将所述各字符对应的字符特征图投影到高维空间中,确定所述各字符对应的字符特征图在所述高维空间中的字符特征表示;
以不同形态的相同字符的字符特征表示靠近同一特征中心,不同特征中心在所述高维空间中的距离越远为优化目标,调整不同特征中心在所述高维空间中的位置,以对所述识别模型进行训练,其中,所述高维空间的不同特征中心对应不同的字符。
可选地,将所述各样本图像输入到识别模型中,确定所述各样本图像中包含的各字符对应的字符特征图,具体包括:
将所述各样本图像输入到识别模型中,确定所述各样本图像对应的各字符串特征图,其中,每一字符串特征图对应一个字符串;
对所述各字符串特征图进行分割,以确定所述各样本图像中包含的各字符对应的字符特征图。
可选地,对所述各字符串特征图进行分割,以确定所述各样本图像中包含的各字符对应的字符特征图,具体包括:
针对每一样本图像,对该样本图像对应的字符串特征图进行分割,得到该样本图像中包含的每一子特征图;
保留包含至少部分字符特征的子特征图,作为该样本图像中包含的各字符对应的字符特征图。
可选地,通过所述识别模型将所述各字符对应的字符特征图投影到高维空间中,确定所述各字符对应的字符特征图在所述高维空间中的字符特征表示,具体包括:
将所述各样本图像输入所述识别模型中,确定所述各样本图像中包含的每一字符的识别结果,以及每一字符的识别结果对应的准确率;
根据所述每一字符的识别结果对应的准确率,滤除所述准确率低于预设阈值的字符特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210037227.8/2.html,转载请声明来源钻瓜专利网。





