[发明专利]动态柜图像识别模型训练方法、装置、电子设备和介质有效
| 申请号: | 202210115424.7 | 申请日: | 2022-02-07 |
| 公开(公告)号: | CN114155366B | 公开(公告)日: | 2022-05-20 |
| 发明(设计)人: | 邓博洋;程杨武 | 申请(专利权)人: | 北京每日优鲜电子商务有限公司 |
| 主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 史立状 |
| 地址: | 100102 北京市朝阳区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 动态 图像 识别 模型 训练 方法 装置 电子设备 介质 | ||
本公开的实施例公开了动态柜图像识别模型训练方法、装置、电子设备和介质。该方法的一具体实施方式包括:获取第一动态柜图像;将第一动态柜图像输入至预先训练的第一图像特征提取网络,得到第一图像特征向量;确定第一动态柜图像所对应的至少一个第一检测框;根据第一动态柜图像、第一图像特征向量、预先存储的第二动态柜图像集,预先存储的第一物品图像集和至少一个第一检测框,生成第三动态柜图像;将第三动态柜图像作为训练图像样本,利用机器学习模型训练方法,训练动态柜图像识别模型,得到训练后的动态柜图像识别模型。该实施方式可以生成识别效果更为精准的动态柜图像识别模型。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及动态柜图像识别模型训练方法、装置、电子设备和介质。
背景技术
目前,目标检测模型已广泛应用于各个领域。当前目标检测模型训练过程中,常常存在目标检测模型对应训练图像样本不足的问题。对于生成更多的训练图像样本,通常采用的方式为:通过数据增强的方式(例如,图像旋转,图像移位,图像放缩等方式)来生成更多的训练图像样本。
然而,当采用上述方式来生成训练图像样本,经常会存在如下技术问题:
第一,数据增强生成的训练图像样本样式较为单一,不能为后续目标检测模型的训练提供更多的特征信息,导致后续训练后的目标检测模型的预测精准度较低。
第二,提取第一动态柜图像的特征提取网络往往需要第一动态柜图像的标签。现实生活中,往往需要大量第一动态柜图像来对目标检测模型进行训练。大量动态柜图像的标注浪费了大量时间,且存在动态柜图像标注错误的问题。
第三,利用数据增强中图像裁剪和相似图像拼接的方式,所生成的训练图像样本虽然存在较多的特征信息。但是,存在确认相似图像准确率较低的问题。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了动态柜图像识别模型训练方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种动态柜图像识别模型训练方法,包括:获取第一动态柜图像;将上述第一动态柜图像输入至预先训练的第一图像特征提取网络,得到第一图像特征向量;确定上述第一动态柜图像所对应的至少一个第一检测框;根据上述第一动态柜图像、上述第一图像特征向量、预先存储的第二动态柜图像集,预先存储的第一物品图像集和上述至少一个第一检测框,生成第三动态柜图像,其中,上述第二动态柜图像集存在对应的第二检测框集组,上述第二检测框集组中各个第二检测框对应的图像为上述第一物品图像集;将上述第三动态柜图像作为训练图像样本,利用机器学习模型训练方法,训练动态柜图像识别模型,得到训练后的动态柜图像识别模型。
第二方面,本公开的一些实施例提供了一种动态柜图像识别模型训练装置,包括:获取单元,被配置成获取第一动态柜图像;输入单元,被配置成将上述第一动态柜图像输入至预先训练的第一图像特征提取网络,得到第一图像特征向量;确定单元,被配置成确定上述第一动态柜图像所对应的至少一个第一检测框;生成单元,被配置成根据上述第一动态柜图像、上述第一图像特征向量、预先存储的第二动态柜图像集,预先存储的第一物品图像集和上述至少一个第一检测框,生成第三动态柜图像,其中,上述第二动态柜图像集存在对应的第二检测框集组,上述第二检测框集组中各个第二检测框对应的图像为上述第一物品图像集;训练单元,被配置成将上述第三动态柜图像作为训练图像样本,利用机器学习模型训练方法,训练动态柜图像识别模型,得到训练后的动态柜图像识别模型。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京每日优鲜电子商务有限公司,未经北京每日优鲜电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210115424.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种API自动生成系统
- 下一篇:一种TPU复合胶水、保护膜及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





