[发明专利]获取神经网络训练图像的方法和装置在审
| 申请号: | 202010762363.4 | 申请日: | 2020-07-31 |
| 公开(公告)号: | CN111931836A | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 王彦婷;王江平;梅娟;王德 | 申请(专利权)人: | 上海商米科技集团股份有限公司;广东川田科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32;G06N3/04;G06N3/08 |
| 代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 金炜霞 |
| 地址: | 200433 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 获取 神经网络 训练 图像 方法 装置 | ||
1.一种获取神经网络训练图像的方法,其特征在于,包括:
控制多个摄像机对商品进行拍摄,生成多个商品图像,所述多个摄像机的拍摄角度互不相同;
获取背景图像;
根据所述多个商品图像和所述背景图像生成多个训练图像,所述多个训练图像中每个训练图像包括所述背景图像的画面和至少一个所述商品图像的画面。
2.根据权利要求1所述的方法,其特征在于,所述多个摄像机设置于圆弧支架上,所述圆弧支架的半径与水平面垂直,所述商品位于所述圆弧支架的圆心处,所述控制多个摄像机对商品进行拍摄,包括:
控制所述圆弧支架沿水平面旋转一周对所述商品进行拍摄。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述多个商品图像和所述背景图像生成多个训练图像,包括:
将所述商品的画面从所述多个商品图像中分割出来;
对所述商品的画面进行缩放处理;
将缩放处理后的所述商品的画面粘贴至所述背景图像中,生成所述多个训练图像。
4.根据权利要求3所述的方法,其特征在于,缩放处理后的所述商品的画面的排布与所述背景图像的背景类型存在关联关系。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对所述多个训练图像进行色彩增强处理。
6.一种训练神经网络的方法,其特征在于,包括:
获取如权利要求1至5中任一项所述的训练图像;
对所述训练图像进行下采样生成多个特征图,所述多个特征图的尺度互不相同;
通过所述神经网络对所述多个特征图对应的训练图像进行二分类处理,确定包含对象的感兴趣区域ROI边框;
通过所述神经网络对所述ROI边框中的对象进行多分类处理,确定所述对象的种类;
根据所述二分类处理的损失函数和所述多分类处理的损失函数训练所述神经网络。
7.根据权利要求6所述的方法,其特征在于,所述通过所述神经网络对所述多个特征图进行二分类处理,确定包含对象的感兴趣区域ROI边框,包括:
通过所述神经网络确定所述多个特征图对应的每个训练图像的锚框;
确定所述每个训练图像的锚框与真实标注框的重叠度iou;
对iou大于阈值的锚框进行回归处理,所述回归处理用于基于所述真实标注框的位置微调所述锚框的位置;
对回归处理后的锚框进行非最大值抑制NMS处理,确定所述ROI边框。
8.根据权利要求6或7所述的方法,其特征在于,所述通过所述神经网络对所述ROI边框中的对象进行多分类处理,确定所述对象的种类,包括:
通过所述神经网络对所述ROI边框进行回归处理,所述回归处理用于基于所述真实标注框的位置微调所述ROI边框的位置;
对回归处理后的所述ROI边框进行多分类处理,确定所述对象的种类。
9.根据权利要求6或7所述的方法,其特征在于,所述二分类处理的损失函数和所述多分类处理的损失函数包括分类损失函数和回归损失函数,所述分类损失函数为交叉熵损失函数,所述回归损失函数为所述ROI边框与所述真实标注框之间的坐标偏移量的L1范数。
10.根据权利要求9所述的方法,其特征在于,所述神经网络的训练条件包括:
初始学习率为0.1;每2500次迭代保存一次所述神经网络的模型,当迭代次数达到90000时停止训练;每个图像处理器GPU每次处理的训练图像的数量为2。
11.一种获取训练图像的装置,其特征在于,包括:用于执行权利要求1至5中任一项所述的方法的单元。
12.一种训练神经网络的装置,其特征在于,包括:用于执行权利要求6至10中任一项所述的方法的单元。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得处理器执行权利要求1至5中任一项所述的方法,和/或,使得处理器执行权利要求6至10中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商米科技集团股份有限公司;广东川田科技有限公司,未经上海商米科技集团股份有限公司;广东川田科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010762363.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种并行光学相干层析成像设备及辅助装调方法
- 下一篇:空调器的控制方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





