[发明专利]数据标注方法、装置和电子设备在审
| 申请号: | 202110427397.2 | 申请日: | 2021-04-20 |
| 公开(公告)号: | CN113139072A | 公开(公告)日: | 2021-07-20 |
| 发明(设计)人: | 张兵;沈蓓;韦松;李瑛 | 申请(专利权)人: | 苏州挚途科技有限公司 |
| 主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/215;G06F16/55;G06F16/58;G06K9/62;G06N20/00 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 荣颖佳 |
| 地址: | 215100 江苏省苏州市相城区高铁新城南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 标注 方法 装置 电子设备 | ||
本发明提供了一种数据标注方法、装置和电子设备。其中,该方法包括:获取目标数据;将目标数据输入预先训练完成的数据标注模型中,输出最终标注结果;其中,数据标注模型包含多个数据标注子模型,数据标注模型基于多个数据标注子模型的泛化能力确定最终标注结果。其中,数据标注模型基于包含的多个数据标注子模型的泛化能力确定最终标注结果。该方式中,使用数据标注模型进行数据标注,可以代替人工标注,从而提高数据标注的效率,降低数据标注低成本;使用包含多个数据标注子模型的数据标注模型进行数据标注,可以获得比较好的标注效果。
技术领域
本发明涉及深度学习和自动驾驶的技术领域,尤其是涉及一种数据标注方法、装置和电子设备。
背景技术
目前,自动驾驶使用的深度学习模型在训练时需要使用标注过的数据,上述标注数据的来源主要分为两种,一部分是公开数据集中的数据,另一部分是自采数据然后再人工标注的数据。
然而,公开数据集数据获取的场景通常与模型的实际应用场景并不一致,导致模型的效果不佳。例如:很多公开数据集的数据是在地区A的道路采集的,道路结构、车流量、行驶规则、行驶习惯、甚至传感器的清晰度、安装位置均与模型的实际应用场景地区B不同,会带来很大的数据差异性,而基于这些数据训练出的模型,在地区B使用的效果必然达不到预期。
此外,人工标注数据则存在标注效率低、成本高的问题。人工标注数据需要人工一张一张标注每个图像,人眼去识别并手动给出目标的类别,并绘制出目标的边界框,每张图片的标注时间长,尤其是当图片中的目标比较多时,标注时间成倍增加。因此人工标注的效率比较低,时间成本和经济成本都很高,不利于深度学习模型的训练和模型性能的提高。
发明内容
有鉴于此,本发明的目的在于提供一种数据标注方法、装置和电子设备,以提高标注效率,降低标注成本。
第一方面,本发明实施例提供了一种数据标注方法,方法包括:获取目标数据;将目标数据输入预先训练完成的数据标注模型中,输出最终标注结果;其中,数据标注模型包含多个数据标注子模型,数据标注模型基于多个数据标注子模型的泛化能力确定最终标注结果。
在本发明较佳的实施例中,上述获取目标数据的步骤,包括:在指定场景中采集目标数据;对采集的目标数据进行数据清洗。
在本发明较佳的实施例中,上述数据清洗至少包括以下之一:灰度直方图处理、图像信息熵处理、图像哈希相似度处理。
在本发明较佳的实施例中,上述将目标数据输入预先训练完成的数据标注模型中,输出最终标注结果的步骤,包括:确定各个数据标注子模型的泛化能力;将目标数据输入预先训练完成的数据标注模型中,基于泛化能力输出最终标注结果。
在本发明较佳的实施例中,上述确定各个数据标注子模型的泛化能力的步骤,包括:获取多个公开数据集,公开数据集包含多个原始数据和原始数据对应的标注真值;从多个公开数据集中随机提取数据,将提取的数据组合为混合数据集;使用各个数据标注子模型标注混合数据集的数据,得到各个数据标注子模型的第一标注结果;基于第一标注结果和混合数据集中该数据的标注真值,确定各个数据标注子模型的泛化能力。
在本发明较佳的实施例中,上述将目标数据输入预先训练完成的数据标注模型中,基于泛化能力输出最终标注结果的步骤,包括:将目标数据输入各个数据标注子模型中,得到各个数据标注子模型的第二标注结果;基于各个数据标注子模型的第二标注结果和各个数据标注子模型的泛化能力,输出最终标注结果。
在本发明较佳的实施例中,上述基于各个数据标注子模型的第二标注结果和各个数据标注子模型的泛化能力,输出最终标注结果的步骤,包括:基于各个数据标注子模型的第二标注结果和各个数据标注子模型的泛化能力,确定各个数据标注子模型的置信度;将置信度最高的数据标注子模型的第二标注结果,作为最终标注结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州挚途科技有限公司,未经苏州挚途科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110427397.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高低频串行图像数据的训练方法
- 下一篇:光子晶体垂直腔面发射激光器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





