[发明专利]一种模型训练方法、装置、电子设备及存储介质在审
申请号: | 202111158035.4 | 申请日: | 2021-09-28 |
公开(公告)号: | CN113902001A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 王晓波;陈佳 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 贾伟;张颖玲 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 电子设备 存储 介质 | ||
本发明实施例适用于计算机技术领域,提供了一种模型训练方法、装置、电子设备及存储介质,其中,模型训练方法包括:对至少两张第一图像中的每张第一图像的部分图像内容进行遮挡,得到至少两张第二图像;至少两张第一图像对应至少两种图像类别,且至少两张第一图像中的不同类别的第一图像之间的相似度大于设定值;基于至少两张第一图像和至少两张第二图像训练第一模型;训练得到的第一模型用于识别输入图像的图像类别。
技术领域
本发明涉及计算机技术领域,尤其涉及一种模型训练方法、装置、电子设备及存储介质。
背景技术
目前,许多办公场景需要使用图像识别模型来识别图像的类别,对于敏感办公图像,比如发票和红头印章文件等易混淆的敏感办公图像,相关技术通过图像识别模型识别时容易识别错误,图像识别模型的识别准确率低。
发明内容
为了解决上述问题,本发明实施例提供了一种模型训练方法、装置、电子设备及存储介质,以至少解决相关技术图像识别模型的识别准确率低的问题。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种模型训练方法,该方法包括:
对至少两张第一图像中的每张第一图像的部分图像内容进行遮挡,得到至少两张第二图像;所述至少两张第一图像对应至少两种图像类别,且所述至少两张第一图像中的不同类别的第一图像之间的相似度大于设定值;
基于所述至少两张第一图像和所述至少两张第二图像训练第一模型;训练得到的所述第一模型用于识别输入图像的图像类别。
上述方案中,所述对至少两张第一图像中的每张第一图像的部分图像区域进行遮挡,包括:
在所述至少两张第一图像的每张第一图像中选定一个设定区域;
使用设定颜色的像素块填充所述设定区域。
上述方案中,所述对至少两张第一图像中的每张第一图像的部分图像区域进行遮挡,包括:
在所述至少两张第一图像中的每张第一图像中随机选择部分图像区域进行遮挡,得到所述至少两张第一图像的每张第一图像对应的至少两张第二图像。
上述方案中,所述基于所述至少两张第一图像和所述至少两张第二图像训练第一模型,包括:
将所述至少两张第一图像和所述至少两张第二图像输入所述第一模型,得到所述第一模型输出的关于第一图像的第一概率值和对应的第二图像的第二概率值;所述第一概率值表征对应的第一图像的图像类别;所述第二概率值表征对应的第二图像的图像类别;
基于所述第一概率值和所述第二概率值,确定所述至少两种图像类别中的每种图像类别对应的设定的损失函数的损失值;
基于所述损失值更新所述第一模型的权重参数。
上述方案中,所述基于所述损失值更新所述第一模型的权重参数,包括:
对所述至少两种图像类别中的每种图像类别对应的设定的损失函数的损失值进行加权计算,得到加权值;
基于所述加权值更新所述第一模型的权重参数。
上述方案中,在基于所述至少两张第一图像和所述至少两张第二图像训练第一模型之前,所述方法还包括:
删除设定的神经网络模型的网络层数和/或网络通道数,得到所述第一模型。
上述方案中,在基于所述至少两张第一图像和所述至少两张第二图像训练得到所述第一模型之后,所述方法还包括:
将所述第一模型转换为第二模型;所述第二模型用于识别所述至少一张第三图像的图像类别;所述第一模型表征PyTorch模型;所述第二模型表征飞桨PaddlePaddle模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111158035.4/2.html,转载请声明来源钻瓜专利网。