[发明专利]一种高效的数据标注自动审核方法在审
| 申请号: | 201910916348.8 | 申请日: | 2019-09-26 |
| 公开(公告)号: | CN111724119A | 公开(公告)日: | 2020-09-29 |
| 发明(设计)人: | 刘玉杰;孙奉钰;李宗民;张敏杰 | 申请(专利权)人: | 中国石油大学(华东) |
| 主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q10/06;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 266580 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 高效 数据 标注 自动 审核 方法 | ||
本发明属于机器学习与计算机视觉领域,具体公开了一种高效的数据标注自动审核方法,该数据标注审核方法包括如下步骤:s1、获取标注者标注过程中的状态信息;s2、对于获取到的数据上传服务器并存储;s3、提取标注者标注过程中的信息,做初步处理,转化为标准数据形式;s4、基于深度神经网络模型,完成对于数据的空间以及时间特征分析;s5、完成当前标注状态分析,反馈状态信息给标注者,提醒标注者。本发明方法通过深度神经网络完成对于标注者标注过程中表情、动作、声音、鼠标轨迹等信息的分析,自动完成标注质量的分析与反馈工作,减少或避免后台人工审核阶段,提高数据标注的效率以及质量。
技术领域
本发明属于机器学习与计算机视觉领域,涉及一种高效的数据标注自动审核方法。
背景技术
数据标注是人工智能产业的基础,是机器感知现实世界的起点。从某种程度上来说,没有经过标注的数据就是无用数据。
数据标注当前具有庞大的市场需求,据统计显示,当今人工智能公司的总支出中,数据支出要占到20%-30%。机器学习准确度与标注数据的数量和质量呈正比,大量高质量的标注数据能够提高机器学习的准确度。随着机器学习落地需求的日益增加,未来标注数据的需求将会随之增加,提高数据标注质量、降低数据标注成本,对于机器学习的发展应用具有重大意义。
目前,数据标注主要处在前端人工标注,后台人工审核的阶段,存在效率低、交付质量参差不齐等问题。
人工标注阶段需要长时间、大量的重复工作,比较枯燥,劳动强度大,容易使标注者厌倦、疲劳,即使专业的数据标注团队仍然可能因为这样的厌倦和疲劳状态导致标注出现差错的情况,这需要后台人工审核标注保证标注质量,从而产生了额外的工作量,导致标注效率低下,增加数据标注的成本。
因此,有必要构建一种高效的数据标注自动审核方法,来提高数据标注的质量。
发明内容
本发明的目的在于提出一种高效的数据标注自动审核方法,其采用如下方案:
一种高效的数据标注自动审核方法,包括如下步骤:
s1、获取标注者标注过程中的状态信息,包括标注者在标注过程中的表情、语言、动作和鼠标、键盘操作等信息,包括其中一种或几种信息的组合;
s2、对于获取到的数据上传服务器并存储;
s3、提取标注者标注过程中的信息,做初步处理,转化为标准的数据形式;
s4、基于深度神经网络模型,完成对于数据的空间以及时间特征分析;
s5、完成当前标注状态的质量分析,反馈标注质量信息给标注者,提醒标注者;
进一步,上述步骤s1中进一步包括:
s11、获取标注者标注环境的摄像头、麦克风设备的权限,检测当前标注者的标注环境是否适合开展标注工作,同时检测当前标注者是否在视频的合适位置,检测标注者的音频环境是否合格;
s12、在标注者标注的过程中实时地获取标注者标注状态的表情,动作,声音和鼠标轨迹、键盘操作等信息,以及标注题目、标注时间等基础信息并完成存储工作;
进一步,上述步骤s2中,需要将对于s1中获取到的信息上传到服务器的指定位置中,并完成存储工作。
进一步,上述步骤s3中,完成对于这些信息的分别存储并转化为标准数据格式。
进一步,数据处理的具体步骤为:
s31、完成对于视频的处理工作,提取视频中的音频信息,以及每一帧的图像信息,将每一帧转化为标准格式,将获取到的音频以及图像信息存储到指定路径;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910916348.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体封装件
- 下一篇:车辆的高压继电器系统及其诊断方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





