[发明专利]图像数据标注方法及其装置在审
申请号: | 201910471476.6 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110189406A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 马岳文;郁树达;郭林杰;邹成;李思琪;赵雄心;周大江 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06T17/00 | 分类号: | G06T17/00;G06F16/58 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像数据 虚拟合成 图像数据标注 标注信息 标注 采集图像数据 任务场景 神经网络 三维模型 三维重建 重建 申请 | ||
本申请公开了一种图像数据标注方法及其装置。所述图像数据标注方法,包括:对任务场景进行三维重建;根据重建的任务场景的三维模型,生成虚拟合成图像数据,其中,所述虚拟合成图像数据带有任务所需的标注信息;利用所述虚拟合成图像数据和所述虚拟合成图像数据带有的所述标注信息,训练预标注神经网络;利用所述预标注神经网络对实拍采集图像数据进行标注,生成所述实拍采集图像数据的标注信息。
技术领域
本说明书涉及计算机视觉领域。
背景技术
近年来深度学习在多个领域取得了突破,特别是在图像检测识别任务上将准确率提升到了前所未有的高度,从而促进了人工智能在更多商业领域的落地,然而深度学习技术的应用依赖于大量带有标注信息的图像数据。对于实拍采集图像数据,需要进行标注以后方可用于深度学习。有别于实拍采集图像数据,虚拟合成图像数据天然带有深度学习所需要的标注信息,如轮廓,类别等。
现有技术中,用于处理图像检测识别任务的深度学习,主要有以下两种技术方案:
1.谷歌流体标注系统
该系统基于imageNet数据库训练了一个通用的检测识别网络,并将该检测识别网络应用于新的待标注图像生成一系列轮廓及标签的候选项供人工选择。同时开发了一套交互系统方便人工操作,标注效率是传统人工标注的3倍。但是,由于该检测识别网络的训练基于一个包含大量类别物体的通用数据集,在应用于细分场景的图像时,其检测识别的精度往往会比较低,此时需要大量的人工干预才能取得比较好的标注效果,其标注效率就会相应地显著降低。
2.基于虚拟样本深度学习的机器人目标识别和位姿重构方法
通过3D渲染从多视角获得物体的图像,用于训练物体检测及姿态估计神经网络。但是,由于虚拟合成与实际采集图像之间存在域的差异,基于虚拟合成数据训练的网络直接应用于真实采集数据的任务精度存在不确定性,对于精度要求极高的领域存在应用风险。
发明内容
本说明书提供了一种图像数据标注方法及其装置,用以解决现有技术中图像标注效率低,标注结果不准确的问题。
本申请的实施方式公开了一种图像数据标注方法,包括:
对任务场景进行三维重建;
根据重建的任务场景的三维模型,生成虚拟合成图像数据,所述虚拟合成图像数据带有任务所需的标注信息;
利用所述虚拟合成图像数据和所述虚拟合成图像数据带有的所述标注信息,训练预标注神经网络;
利用所述预标注神经网络对实拍采集图像数据进行标注,生成所述实拍采集图像数据的标注信息。
本申请的实施方式还公开了一种图像数据标注装置,包括:
场景重建模块,用于对任务场景进行三维重建;
虚拟合成模块,用于根据重建的任务场景的三维模型,生成虚拟合成图像数据,所述虚拟合成图像数据带有任务所需的标注信息;
预标注网络训练模块,用于利用所述虚拟合成图像数据和所述虚拟合成图像数据带有的所述标注信息,训练预标注神经网络;
标注模块,利用所述预标注神经网络对实拍采集图像数据进行标注,生成所述实拍采集图像数据的标注信息。
本申请的实施方式还公开了一种图像数据标注设备,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行所述计算机可执行指令时实现上述方法中的步骤。
本申请的实施方式还公开了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现上述方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910471476.6/2.html,转载请声明来源钻瓜专利网。