[发明专利]一种基于离线数据增强的固废数据集生成方法在审
| 申请号: | 202111063333.5 | 申请日: | 2021-09-10 |
| 公开(公告)号: | CN113807424A | 公开(公告)日: | 2021-12-17 |
| 发明(设计)人: | 李建涛;杨建红;计天晨;房怀英;林柏宏;杨宇轩;杨天成;陈伟鑫 | 申请(专利权)人: | 华侨大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;王婷婷 |
| 地址: | 362000 福建省*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 离线 数据 增强 生成 方法 | ||
一种基于离线数据增强的固废数据集生成方法,具体包括:手动标注第一固废数据集A1;对第一固废数据集A1进行离线数据增强生成第二固废数据集A2,合并第一固废数据集A1和第二固废数据集A2,形成合并固废数据集;使用深度学习模型对合并固废数据集进行训练;使用训练好的深度学习模型对未标注的固废数据集D进行预测;通过查询函数找出深度学习模型预测不准确的图像集,并进行手动标注得到第三固废数据集B1;对第三固废数据集B1进行离线数据增强生成第四固废数据集B2。本发明提出的方法可以生成大量固废数据集,快速有效地构扩充固废数据集,从而有助于深度学习模型的训练,进一步提升固废识别的准确率。
技术领域
本发明涉及深度学习及固废识别领域,特别涉及基于离线数据增强的固废固废数据集生成方法。
背景技术
随着近年来的快速发展,深度学习在越来越多的领域发挥作用,其中就包括固废检测领域。为了让深度学习能够在固废上取得良好的效果,企业往往需要获得高质量的固废数据集。对于企业来说,获取图像数据是很容易的。只要搭建好检测平台,通过工业相机的连续拍摄仅需一天就能获得上万张图像。然而,对于用于检测的深度学习网络模型来说,用于模型训练的固废数据集不是单一的图像数据,而是带有标签的图像。为了获取高质量的标签,现阶段常见的方法是请专业的人员对每张图像进行仔细标注,而繁琐的标注过程不仅会耗费大量人力,而且需要长时间的标注才能得到所需数量要求的固废数据集。
此外,由于背景的变化、光照的影响等等,使用某一场景下标注好的固废数据集进行训练的深度学习模型,换个场景就可能检测效果不好,这往往会导致工程师需要重新采集大量的图像并进行长时间的标注。如果仅是采用人工标注模式来得到固废数据集,会延长项目的研发周期,从而拖慢生产进程。
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于离线数据增强的固废数据集生成方法,能够快速有效地扩充标注的固废数据集,代替人工标注,节省时间人力,并提高深度学习模型检测的性能,进一步提升固废识别的准确率。
本发明采用如下技术方案:
一种基于离线数据增强的固废数据集生成方法,方法具体步骤如下:
手动标注第一固废数据集A1;
对第一固废数据集A1进行离线数据增强生成第二固废数据集A2,合并第一固废数据集A1和第二固废数据集A2,形成合并固废数据集;
使用深度学习模型对合并固废数据集进行训练;
使用训练好的深度学习模型对未标注的固废数据集D进行预测;
通过查询函数找出深度学习模型预测不准确的图像集,并进行手动标注得到第三固废数据集B1;
对第三固废数据集B1进行离线数据增强生成第四固废数据集B2。
具体地,所述的深度学习模型包括但不限于实例分割模型和目标检测模型。
具体地,所述的固废数据集离线数据增强,包括如下步骤:
读取需要进行离线数据增强的固废数据集的标签,分离出固废数据集中每个物体以及物体的标签信息;
将分离出的物体进行几何变换、改变图像亮度与图像对比度,得到增强的物体以及标签信息;
随机将N个增强之后的物体粘贴到一个图像模板上,同时将该N个物体的标签信息存入该模板对应的标签文件当中,N为整数。
具体地,所述标签信息包括物体的轮廓信息以及物体的类别信息。
具体地,所述分离出固废数据集中每个物体以及物体的标签信息固废数据集有如下步骤:
读取图像的标签文件,所述标签文件为json格式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111063333.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





