[发明专利]一种建立识别模型的方法及装置有效
| 申请号: | 201811278815.0 | 申请日: | 2018-10-30 |
| 公开(公告)号: | CN111126420B | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | 朱丽 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
| 主分类号: | G06V30/19 | 分类号: | G06V30/19 |
| 代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
| 地址: | 310051 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 建立 识别 模型 方法 装置 | ||
本文公开了一种建立识别模型的方法及装置,该方法可包括:利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的所述图像样本中包含的字符串;利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。本申请能够大幅减少迭代次数,同时还可有效提升识别模型的识别率。
技术领域
本申请涉及信息处理技术领域,尤其涉及一种建立识别模型的方法及装置。
背景技术
在机器学习领域,利用大量图像样本进行训练,可以获得识别模型,该识别模型能够识别图像中的文本信息。如,通过识别模型可以识别监控图像或照片中的车牌号、建筑物标识、集装箱箱号、证件号码等文本信息。
目前,可通过有监督学习、半监督学习和无监督学习来获得识别模型。其中,无监督学习是利用一组未知类别的图像样本进行训练,以获得满足性能要求的识别模型。而训练识别模型所使用的图像样本是否准确,将直接决定训练过程中的迭代次数以及识别模型的识别率。因此,为确保使用的图像样本相对准确,无监督学习需要先对图像样本进行处理。相关技术中,主要采用人工标定的方式对图像样本进行处理,而人工标定不仅耗费人力,而且错误率高,处理后的图像样本的准确率也较低,这不仅会大幅增加训练识别模型时的迭代次数,而且会直接影响识别模型的识别率。
发明内容
本发明的目的是通过以下技术方案实现的。
一种建立识别模型的方法,包括:
利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的所述图像样本中包含的字符串;
利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
其中,所述利用所述训练集进行训练,以获得识别模型,包括:当获得的所述识别模型未满足预设的迭代条件时,利用所述识别模型对所述批量图像样本进行预测,得到新的预测结果;利用所述字符校验规则对所述预测结果进行校验,并以校验通过的所述预测结果所对应的图像样本更新所述训练集;利用更新的所述训练集进行训练,直到训练得到的所述识别模型满足预设的迭代条件。
其中,所述迭代条件为所述识别模型的识别率不低于预先设定的识别率阈值。
其中,所述以校验通过的预测结果所对应的图像样本形成训练集,包括:所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集。
其中,所述利用所述训练集进行训练,以获得识别模型,包括:分别利用不同的训练集进行训练,以获得不同字符校验规则对应的识别模型。
一种建立识别模型的装置,包括:
预测模块,用于利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的为所述图像样本中包含的字符串;
校验模块,用于利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
训练模块,用于利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811278815.0/2.html,转载请声明来源钻瓜专利网。





