[发明专利]一种图像数据集辅助标记系统及方法在审
申请号: | 201810734583.9 | 申请日: | 2018-07-06 |
公开(公告)号: | CN108898188A | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 姜柏帆;张岚;程平;杨正军 | 申请(专利权)人: | 四川奇迹云科技有限公司;四川虹电数字家庭产业技术研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 邹敏菲;吴静宜 |
地址: | 610000 四川省成都市中国(四川)自由贸易*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 神经网络训练 图像数据集 辅助标记 费力 标签 图像数据预处理 图像 神经网络 特征提取 图像信息 文档格式 文档 | ||
本发明公开了一种图像数据集辅助标记系统及方法,旨在解决现有技术中采用人工方法对数据集进行标记方法费时费力且准确性低的问题;本发明利用神经网络训练的思想对神经网络训练所需的图像进行初步特征提取训练,对图像进行识别标记获得神经网络所需的标签文档格式,在大量的图像信息中获得某一类的标签文档,解决了现有的人工方法对数据集进行标记方法费时费力且准确性低的问题,扩展了数据集以及提高数据集生成的效率及准确性;本发明适用于图像数据预处理相关领域。
技术领域
本发明涉及涉及图像数据预处理相关领域,具体涉及一种图像数据集辅助标记系统及方法。
背景技术
“机器学习”一般被定义为一个系统自我改进的过程。从最初的基于神经元模型以及函数逼近论的方法研究,到以符号演算为基础的规则学习和决策树学习的产生,和以后的认知心理学中归纳、解释、类比等概念的引入,至最新的计算学习理论和统计学习的兴起,机器学习一直都在相关学科的实践应用中起着主导作用。这门学科所关注的重点问题是:计算机程序如何随着经验积累自动提高性能。近年来,机器学习被成功地应用于很多领域,包括检测信用卡交易欺诈的数据挖掘程序,获取用户阅读兴趣的信息过滤系统,以及能在高速公路上自动行驶的汽车等等。与此相辅相成的是,机器学习学科的基础理论和算法也有了相当重大的进展。
物体检测是机器学习中相当重要的应用分支,它经历了传统的人工设计特征+浅层分类器的框架,到基于大数据和深度神经网络End-To-End的物体检测框架的发展。物体检测的流程可以大致包括:图像预处理-图像分割-特征提取-判断匹配-输出结果。针对特征提取的方法不同,也分为人工特征提取和利用卷积神经网络的机器提取。
随着利用卷积神经网络等的深度学习技术逐步发展,为了提高识别的效果和扩大到更广泛的应用场景,对于特定标记的图片数据集的要求越来越大。这些标注的数据集广泛应用于人脸识别,物体识别,医疗医学等等领域。按照常规的主流的做法,数据集的标注是利用人工的方法进行单张逐一标注。这种方法费时费力,效率很低,也容易因为人为的因素产生各种例如矩形框位置偏离,标签混乱的错误,而一旦前面的数据集标记准确率过低,将导致后面的训练准确率降低。
发明内容
本发明的目的在于:针对现有技术中采用人工方法对数据集进行标记方法费时费力且准确性低的问题,本发明提供了一种图像数据集辅助标记系统及方法。
本发明采用的技术方案如下:
一种图像数据集辅助标记系统,包括图像获取模块、图像特征提取模块、数据集扩充模块、图像识别定位模块、防错检查模块和文档生成模块;
所述图像获取模块:获取样本图像数据库以及目标图像数据库;
所述图像特征提取模块:获取图像获取模块所发送的样本图像数据库并提取得到样本图像特征,再获取图像获取模块所发送的目标图像数据库并提取得到目标图像特征;
所述图像识别定位模块:获取图像特征提取模块所发送的样本图像特征并训练得到图像识别分类器,根据识别分类器对图像特征提取分类后的目标图像特征识别定位;
所述数据集扩充模块:接收图像识别定位模块所输出的目标图像数据库并扩充得到目标图像数据集;
所述防错检查模块:接收并检查数据集扩充模块所输出的目标图像数据集并检查是否有错误的目标图像,若有,则将目标图像返回至图像识别定位模块继续识别定位,若无,则输出准确目标图像数据集;
所述文档生成模块:接收防错检查模块所输出的准确目标图像数据集并生成标签文档格式。
防错检查模块可以选用机器纠错或人工纠错。
本发明还提供了一种图像数据集辅助标记方法,包括以下步骤:
步骤1:获取样本图像数据库以及目标图像数据库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川奇迹云科技有限公司;四川虹电数字家庭产业技术研究院有限公司,未经四川奇迹云科技有限公司;四川虹电数字家庭产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810734583.9/2.html,转载请声明来源钻瓜专利网。