[发明专利]数据标注方法、装置和电子设备在审

专利信息
申请号: 202110427397.2 申请日: 2021-04-20
公开(公告)号: CN113139072A 公开(公告)日: 2021-07-20
发明(设计)人: 张兵;沈蓓;韦松;李瑛 申请(专利权)人: 苏州挚途科技有限公司
主分类号: G06F16/51 分类号: G06F16/51;G06F16/215;G06F16/55;G06F16/58;G06K9/62;G06N20/00
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 荣颖佳
地址: 215100 江苏省苏州市相城区高铁新城南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 标注 方法 装置 电子设备
【说明书】:

发明提供了一种数据标注方法、装置和电子设备。其中,该方法包括:获取目标数据;将目标数据输入预先训练完成的数据标注模型中,输出最终标注结果;其中,数据标注模型包含多个数据标注子模型,数据标注模型基于多个数据标注子模型的泛化能力确定最终标注结果。其中,数据标注模型基于包含的多个数据标注子模型的泛化能力确定最终标注结果。该方式中,使用数据标注模型进行数据标注,可以代替人工标注,从而提高数据标注的效率,降低数据标注低成本;使用包含多个数据标注子模型的数据标注模型进行数据标注,可以获得比较好的标注效果。

技术领域

本发明涉及深度学习和自动驾驶的技术领域,尤其是涉及一种数据标注方法、装置和电子设备。

背景技术

目前,自动驾驶使用的深度学习模型在训练时需要使用标注过的数据,上述标注数据的来源主要分为两种,一部分是公开数据集中的数据,另一部分是自采数据然后再人工标注的数据。

然而,公开数据集数据获取的场景通常与模型的实际应用场景并不一致,导致模型的效果不佳。例如:很多公开数据集的数据是在地区A的道路采集的,道路结构、车流量、行驶规则、行驶习惯、甚至传感器的清晰度、安装位置均与模型的实际应用场景地区B不同,会带来很大的数据差异性,而基于这些数据训练出的模型,在地区B使用的效果必然达不到预期。

此外,人工标注数据则存在标注效率低、成本高的问题。人工标注数据需要人工一张一张标注每个图像,人眼去识别并手动给出目标的类别,并绘制出目标的边界框,每张图片的标注时间长,尤其是当图片中的目标比较多时,标注时间成倍增加。因此人工标注的效率比较低,时间成本和经济成本都很高,不利于深度学习模型的训练和模型性能的提高。

发明内容

有鉴于此,本发明的目的在于提供一种数据标注方法、装置和电子设备,以提高标注效率,降低标注成本。

第一方面,本发明实施例提供了一种数据标注方法,方法包括:获取目标数据;将目标数据输入预先训练完成的数据标注模型中,输出最终标注结果;其中,数据标注模型包含多个数据标注子模型,数据标注模型基于多个数据标注子模型的泛化能力确定最终标注结果。

在本发明较佳的实施例中,上述获取目标数据的步骤,包括:在指定场景中采集目标数据;对采集的目标数据进行数据清洗。

在本发明较佳的实施例中,上述数据清洗至少包括以下之一:灰度直方图处理、图像信息熵处理、图像哈希相似度处理。

在本发明较佳的实施例中,上述将目标数据输入预先训练完成的数据标注模型中,输出最终标注结果的步骤,包括:确定各个数据标注子模型的泛化能力;将目标数据输入预先训练完成的数据标注模型中,基于泛化能力输出最终标注结果。

在本发明较佳的实施例中,上述确定各个数据标注子模型的泛化能力的步骤,包括:获取多个公开数据集,公开数据集包含多个原始数据和原始数据对应的标注真值;从多个公开数据集中随机提取数据,将提取的数据组合为混合数据集;使用各个数据标注子模型标注混合数据集的数据,得到各个数据标注子模型的第一标注结果;基于第一标注结果和混合数据集中该数据的标注真值,确定各个数据标注子模型的泛化能力。

在本发明较佳的实施例中,上述将目标数据输入预先训练完成的数据标注模型中,基于泛化能力输出最终标注结果的步骤,包括:将目标数据输入各个数据标注子模型中,得到各个数据标注子模型的第二标注结果;基于各个数据标注子模型的第二标注结果和各个数据标注子模型的泛化能力,输出最终标注结果。

在本发明较佳的实施例中,上述基于各个数据标注子模型的第二标注结果和各个数据标注子模型的泛化能力,输出最终标注结果的步骤,包括:基于各个数据标注子模型的第二标注结果和各个数据标注子模型的泛化能力,确定各个数据标注子模型的置信度;将置信度最高的数据标注子模型的第二标注结果,作为最终标注结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州挚途科技有限公司,未经苏州挚途科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110427397.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top