[发明专利]一种进行数据增强的方法、装置和存储介质在审
申请号: | 202110006496.3 | 申请日: | 2021-01-05 |
公开(公告)号: | CN113807335A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 齐鹏飞;赖荣凤;梅涛;周伯文 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/42;G06K9/62;G06K17/00 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 吴点;郑红娟 |
地址: | 100083 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 进行 数据 增强 方法 装置 存储 介质 | ||
本申请公开了一种进行数据增强的方法、装置和存储介质,具体为首先获取含有完整目标的待处理数据和所述待处理数据对应的数据增强类型,其次,基于数据增强类型,匹配与待处理数据相应的配置信息,配置信息用于表示待处理数据在进行数据增强类型对应的操作后,待处理数据中目标的完整度,最后,根据配置信息,为待处理数据确定真实标签。本申请实施例通过为经过不同数据增强类型的待处理数据确定真实值,降低对不完整目标的确信度,减少误识率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种进行数据增强的方法、装置和存储介质。
背景技术
在深度学习中对于检测模型有多种数据增强的方法,如对数据进行旋转,翻转,模糊,颜色,光照,饱和度,尺度,目标重叠度(Intersection over Union,IOU)等方式。一般会对数据增强后的目标均标记为对应标签,其值用one hot编码,属于哪个分类,哪个分类对应的真实值就标记为1。但当前数据增强给出的真实值(label)对于目标物体本身完整性和变化后的形态出现的频率并没有考量。将这些低频出现的,或者不完整的目标作为完全正确的真实值为1的数据增强,可能会导致对类似目标的误识。
发明内容
本申请实施例提供了一种进行数据增强的方法,克服了数据增强时标签标识不准确的问题。
该方法包括:
获取含有完整目标的待处理数据和所述待处理数据对应的数据增强类型;
基于所述数据增强类型,匹配与所述待处理数据相应的配置信息,所述配置信息用于表示所述待处理数据在进行所述数据增强类型对应的操作后,所述待处理数据中所述目标的完整度;
根据所述配置信息,为所述待处理数据确定真实标签。
可选地,为所述待处理数据确定所述数据增强类型,所述数据增强类型包括几何变换方式、随机裁剪方式和颜色变换方式。
可选地,当所述数据增强类型为所述随机裁剪方式时,获取对所述待处理数据执行完成所述随机剪裁方式后生成的裁剪后数据;
基于所述裁剪后数据和所述待处理数据,生成所述裁剪后数据和所述待处理数据之间的重叠比信息;
将所述重叠比信息作为双曲正切函数的自变量,计算第一配置信息。
可选地,当所述数据增强类型为所述几何变换方式时,为所述待处理数据匹配第二配置信息,以及当所述数据增强类型为所述颜色变换方式时,为所述待处理数据匹配第三配置信息。
在本发明的另一个实施例中,提供了一种进行数据增强的装置,该装置包括:
获取模块,用于获取含有完整目标的待处理数据和所述待处理数据对应的数据增强类型;
匹配模块,用于基于所述数据增强类型,匹配与所述待处理数据相应的配置信息,所述配置信息用于表示所述待处理数据在进行所述数据增强类型对应的操作后,所述待处理数据中所述目标的完整度;
第一确定模块,用于根据所述配置信息,为所述待处理数据确定真实标签。
可选地,所述装置进一步包括:
第二确定模块,用于为所述待处理数据确定所述数据增强类型,所述数据增强类型包括几何变换方式、随机裁剪方式和颜色变换方式。
可选地,所述匹配模块还包括:
获取单元,用于当所述数据增强类型为所述随机裁剪方式时,获取对所述待处理数据执行完成所述随机剪裁方式后生成的裁剪后数据;
生成单元,用于基于所述裁剪后数据和所述待处理数据,生成所述裁剪后数据和所述待处理数据之间的重叠比信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110006496.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置