[发明专利]一种自动标注方法、装置、设备及可读存储介质在审
申请号: | 202110003636.1 | 申请日: | 2021-01-04 |
公开(公告)号: | CN112685998A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 冯斐帆;李波 | 申请(专利权)人: | 广联达科技股份有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06K9/20;G06K9/62 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
地址: | 100193 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 标注 方法 装置 设备 可读 存储 介质 | ||
本发明公开了一种自动标注方法、装置、设备及可读存储介质,所述方法包括:响应于触发的对待处理图像中识别出目标对象,并在所述待处理图像中绘制出用于框选出所述目标对象的标注框;响应于触发的启动语音调整标注框操作,获取用户语音指令,并根据处理图像进行标注的标注指令,获取与所述标注指令对应的对象识别模型;利用所述对象识别模型从所述待所述用户语音指令对所述待处理图像中的目标标注框进行调整,以完成对所述待处理图像的标注;本发明能够同时提升数据标注的效率和准确性。
技术领域
本发明涉及数据标注技术领域,特别涉及一种自动标注方法、装置、设备及可读存储介质。
背景技术
在数据标注领域,目前采用的标注方式主要是人工标注,即依靠数据标注员通过肉眼识别以对待标注数据集中的目标对象进行标注,通常待标注的数据量会达到万级、十万级或者更多,所以采用人工标注的出错概率较大且效率较低,不能满足日常生产需要;此外,数据标注员还可利用开源的labelme或者modelArts工具进行数据标注,但是,labelme需要配置python环境才能使用,而modelArts是集成在云平台上的工具,需要相应权限才能使用,因此,在利用上述工具进行数据标注时较为繁琐且有较高的学习成本,不够便捷、用户体验度不佳。
发明内容
本发明的目的在于提供一种自动标注方法、装置、设备及可读存储介质,能够同时提升数据标注的效率和准确性。
根据本发明的一个方面,提供了一种自动标注方法,所述方法包括:
响应于触发的对待处理图像进行标注的标注指令,获取与所述标注指令对应的对象识别模型;
利用所述对象识别模型从所述待处理图像中识别出目标对象,并在所述待处理图像中绘制出用于框选出所述目标对象的标注框;
响应于触发的启动语音调整标注框操作,获取用户语音指令,并根据所述用户语音指令对所述待处理图像中的目标标注框进行调整,以完成对所述待处理图像的标注。
可选的,所述获取与所述标注指令对应的对象识别模型,包括:
从预设模型数据库中获取与所述标注指令对应的对象识别模型,其中,所述模型数据库包括预先训练的用于执行识别不同对象的多个对象识别模型;或者,
接收从预设接口上传的预先训练的用于执行识别所述目标对象的对象识别模型。
可选的,所述在所述待处理图像中绘制出用于框选出所述目标对象的标注框,包括:
获取所述目标对象在所述待处理图像中的位置信息;
根据所述位置信息确定出所述标注框的起始点二维坐标和边框尺寸信息;
将所述起始点二维坐标转化为起始点三维坐标;
根据所述起始点三维坐标和所述边框尺寸信息,利用WebGL在所述待处理图像中渲染出所述标注框。
可选的,所述根据所述用户语音指令对所述待处理图像中的目标标注框进行调整,包括:
利用预先训练的语音识别模型,从所述用户语音指令中识别出标识信息和调整信息;
根据所述调整信息对与所述标识信息对应的目标标注框的属性进行调整;其中,所述属性包括:位置和尺寸。
可选的,所述根据所述调整信息对与所述标识信息对应的目标标注框的属性进行调整,具体包括:
当所述调整信息用于调整标注框的位置时,获取所述目标标注框的初始水平宽度和初始垂直高度以及所述待处理画像的水平宽度和垂直高度;
根据所述目标标注框的初始水平宽度和所述待处理画像的水平宽度,计算出第一水平移动步长;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广联达科技股份有限公司,未经广联达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110003636.1/2.html,转载请声明来源钻瓜专利网。