[发明专利]一种数据标注方法、装置及计算设备在审
申请号: | 202110665277.6 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113344083A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 王宪;贾书东;胡飞;吴方贵 | 申请(专利权)人: | 安徽容知日新科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 高攀;赵爱军 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 标注 方法 装置 计算 设备 | ||
本发明公开了一种数据标注方法,在数据标注装置中执行,包括步骤:获取一条或多条结构数据,基于一条或多条结构数据生成数据集;基于数据集建立相应的标注集,标注集中包括一个或多个标注任务,每个标注任务分别对应数据集中的一条结构数据;获取基于标注任务对相应的结构数据进行标注生成的真实标注信息;将数据集中的结构数据输入预定模型,获取经预定模型处理后输出的智能标注信息;将智能标注信息与真实标注信息进行比对,以确定所述预定模型的准确率。本发明还一并公开了相应的数据标注装置和计算设备。
技术领域
本发明涉及人工智能技术领域,特别涉及一种数据标注方法、装置及计算设备。
背景技术
在人工智能技术领域,通常需要基于大量样本来训练算法,以提升算法的准确度和精度。获取覆盖多种场景的样本数据、以及对大量样本数据进行标注处理,成为提升算法准确度的关键。
现有技术中,对样本的标注处理一般只是针对趋势数据,样本数据覆盖的场景单一,而且,现有技术仅支持人工标注,不支持算法的导入,无法基于算法对样本数据进行标注,也无法将人工标注与基于算法的智能标注结果进行比对来验证算法的准确性。
为此,需要一种数据标注方法来解决上述技术方案中存在的问题。
发明内容
为此,本发明提供一种数据标注方法和装置,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供了一种数据标注方法,在数据标注装置中执行,包括步骤:获取一条或多条结构数据,基于所述一条或多条结构数据生成数据集;基于所述数据集建立相应的标注集,所述标注集中包括一个或多个标注任务,每个标注任务分别对应所述数据集中的一条结构数据;获取基于所述标注任务对相应的结构数据进行标注生成的真实标注信息;将所述数据集中的结构数据输入预定模型,获取经所述预定模型处理后输出的智能标注信息;以及将所述智能标注信息与真实标注信息进行比对,以确定所述预定模型的准确率。
可选地,在根据本发明的数据标注方法中,基于所述数据集建立相应的标注集的步骤包括:建立与所述数据集相关联的样本集,所述样本集中适于存储一个或多个样本;建立与所述样本集相对应的一个或多个标注集,所述标注集包括一种或多种标签,以便基于标签对所述结构数据进行标注处理。
可选地,在根据本发明的数据标注方法中,还包括步骤:基于数据集中的每条结构数据和相应的标注信息组合生成样本;将所述样本存储到与所述数据集相关联的样本集。
可选地,在根据本发明的数据标注方法中,建立与所述数据集相关联的样本集的步骤包括:配置生成样本集的基础信息,所述基础信息包括样本集信息以及相关联的数据集信息,以建立样本集与数据集的关联关系。
可选地,在根据本发明的数据标注方法中,将所述智能标注信息与真实标注信息进行比对的步骤包括:利用混淆矩阵模型将所述智能标注信息与真实标注信息进行比对。
可选地,在根据本发明的数据标注方法中,在获取一条或多条结构数据之前,包括步骤:生成一个或多个数据集的配置信息,所述配置信息包括数据集对应的数据结构和数据类型;基于所述数据结构生成数据集对应的数据交互接口。
可选地,在根据本发明的数据标注方法中,获取一条或多条结构数据的步骤包括:基于数据集对应的数据交互接口获取相应数据结构的一条或多条结构数据。
可选地,在根据本发明的数据标注方法中,基于数据集对应的数据交互接口获取相应数据结构的一条或多条结构数据的步骤包括:基于原始数据接口获取原始数据,确定与所述原始数据类型相对应的数据交互接口,并返回所述数据交互接口的路径;基于所述数据交互接口获取与所述原始数据相对应的一条或多条结构数据。
可选地,在根据本发明的数据标注方法中,所述数据类型包括趋势数据、波形数据或频谱数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽容知日新科技股份有限公司,未经安徽容知日新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110665277.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置