[发明专利]OCR识别模型的训练方法、装置和计算机设备在审
| 申请号: | 202010734518.3 | 申请日: | 2020-07-27 |
| 公开(公告)号: | CN111860669A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 叶明;盛建达;张国辉;宋晨 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | ocr 识别 模型 训练 方法 装置 计算机 设备 | ||
本发明涉及人工智能技术,应用于智慧城市中,提出的OCR识别模型的训练方法、装置、计算机设备和存储介质,其中方法包括:获取样本集;对样本集中的部分样本进行标注,以使样本集包括标注样本以及非标注样本;将样本集输入至预设的OCR识别网络中进行计算得到第一特征向量集;将第一特征向量集输入到用于做无监督训练的第一损失计算层计算得到第一损失值集,以及将第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;将第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新OCR识别网络的参数直到收敛,得到OCR识别模型;该OCR识别模型与传统训练方法得到OCR模型相比,识别精度更高。
技术领域
本发明涉及到识别模型的技术领域,特别是涉及到一种OCR识别模型的训练方法、装置、计算机设备和存储介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)是人工智能领域重要的领域,利用OCR可以快速的将光学字符转化为数字化信息,极大的降低了人工录入的成本,因而被广泛地应用在各类票证数字化的系统中。
目前,传统OCR识别一般通过监督学习训练出的识别模型来实现,但传统OCR识别系统存在以下缺陷:训练识别模型时,OCR识别的字符需要预先定义,并针对每个类别的字符,均需要采集大量的样本数据;而且这样训练出来的识别模型对于预先定义以外的字符没有识别能力,需要追加数据二次训练;另外,当训练数据与实际生产环境存在表现差异的时候,系统精度会有比较明显的下降。
发明内容
本发明的主要目的为提供一种OCR识别模型的训练方法、装置、计算机设备和存储介质,旨在解决现有技术中OCR识别模型识别效果不佳的技术问题。
基于上述发明目的,本发明提出一种OCR识别模型的训练方法,包括:
获取样本集;
对所述样本集中的部分样本进行标注,以使所述样本集包括标注样本以及非标注样本;
将所述样本集输入至预设的OCR识别网络中进行计算,得到第一特征向量集;
将所述第一特征向量集输入到用于做无监督训练的第一损失计算层,计算得到第一损失值集,以及将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集;
将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度,以更新所述OCR识别网络的参数直到收敛,得到OCR识别模型。
进一步地,所述将所述第一损失值集与第二损失值集通过网络反向传播计算出网络的参数梯度的步骤,包括:
依据所述非标注样本与所述标注样本的数量得到数量比值,依据所述数据比值获取第一系数与第二系数,其中,所述第一系数与所述第二系数的比值与所述数量比值对应;
将所述第一损失值乘以所述第一系数得到第一值,并将第二损失值乘以第二系数得到第二值,将所述第一值与第二值相加得到函数损失值;
将所述函数损失值通过网络反向传播计算参数梯度。
进一步地,所述将所述第一特征向量集输入到用于做有监督训练的第二损失计算层继续计算得到第二损失值集的步骤之前,包括:
判断所述第一特征向量集中的第一特征向量是否由所述标注样本计算得到的特征向量;
若是,则将所述第一特征向量输入至所述第二损失计算层中;
若否,则将所述第一特征向量剔除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010734518.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网的组合式环保衣柜
- 下一篇:可检测冰淇淋温度的冰淇淋机





