[发明专利]深度学习系统中数据集标注的管理方法和装置有效
| 申请号: | 201811595957.X | 申请日: | 2018-12-20 |
| 公开(公告)号: | CN109670554B | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 李铭琨 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 林桐苒;解婷婷 |
| 地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 深度 学习 系统 数据 标注 管理 方法 装置 | ||
本申请公开了一种深度学习系统中数据集标注的管理方法和装置。所述方法包括:在接收到用户标注数据集中数据的操作请求后,输出预先存储的数据集中已标注的数据,其中所述已标注的数据均有对应的基准标注结果,其中所述基准标注结果是经过验证正确性后得到的标注结果;获取所述用户对所述数据集中已标注的数据的标注结果;根据所述用户对已标注的数据的标注结果以及所述基准标注结果,确定是否允许所述用户执行数据集的标注操作。
技术领域
本申请涉及信息处理领域,尤指一种深度学习系统中数据集标注的管理方法和装置。
背景技术
深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值可以使用多种方式来表示,以一幅画为例,观测值可以为每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务,例如,人脸识别或面部表情识别等。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。
深度学习的数据来源是数据挖掘(Data mining)来得到的,数据挖掘是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。训练数据是指数据挖掘过程中用于训练数据挖掘模型的数据。训练数据选择一般有以下要求:数据样本尽可能大、数据多样化,数据样本质量较高。
在人工智能时代,深度学习作为一种强有力的技术已经开始改变我们生活的方方面面。在深度学习中,拥有数据量大,多样性高,样本质量高的数据集对于深度学习的训练和验证是十分必要的。但是获得高质量的数据集,需要花费大量的人力成本。
发明内容
为了解决上述技术问题,本申请提供了一种深度学习系统中数据集标注的管理方法和装置,能够降低数据集中数据的标注成本。
为了达到本申请目的,本申请提供了一种深度学习系统中数据集标注的管理方法,包括:
在接收到用户标注数据集中数据的操作请求后,输出预先存储的数据集中已标注的数据,其中所述已标注的数据均有对应的基准标注结果,其中所述基准标注结果是经过验证正确性后得到的标注结果;
获取所述用户对所述数据集中已标注的数据的标注结果;
根据所述用户对已标注的数据的标注结果以及所述基准标注结果,确定是否允许所述用户执行数据集的标注操作。
在一个示例性实施例中,所述根据所述用户对已标注的数据的标注结果以及所述基准标注结果,确定是否允许所述用户执行数据集的标注操作,包括:
根据所述数据的基准标注结果,判断所述用户对已标注的数据的标注结果的正确率信息;
将得到的正确率信息与预先设置的正确率阈值进行比较,得到比较结果;
如果比较结果为大于等于所述正确率阈值,则允许所述用户执行数据集的标注操作;否则,拒绝所述用户执行数据集的标注操作。
在一个示例性实施例中,所述根据所述用户对已标注的数据的标注结果以及所述基准标注结果,确定是否允许所述用户执行数据集的标注操作之后,所述方法还包括:
在确定允许对所述数据集进行标注操作之后,获取所述数据集中未标注的数据;
输出所述数据集中未标注的数据,请求所述用户进行标注操作;
在得到所述用户对所述未标注的数据的标注结果后,对所述未标注的数据的标注结果进行验证;
在验证通过后,保存所述用户对所述未标注的数据的标注结果。
在一个示例性实施例中,所述输出所述数据集中未标注的数据,包括:
输出所述数据集中已标注的数据和未标注的数据,其中所述未标注的数据占数据的量总和的比例小于等于m;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811595957.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





