[发明专利]图像标注方法及装置、特征图生成方法及装置在审
申请号: | 201811584634.0 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109658481A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 李健昆;范浩强 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06N3/04;G06N3/08 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 像素 图像标注 结果图像 相似性度量 特征图 集合 相似性度量计算 实时显示 像素集合 形状支持 原始图像 自适应性 预览 检测 | ||
本发明涉及图像标注技术领域,提供一种图像标注方法及装置、特征图生成方法及装置。其中,图像标注方法包括:当检测到画刷的第一操作时,确定第一操作对应的原始图像中的第一像素;获取画刷范围内的每个第二像素与第一像素的相似性度量;根据相似性度量确定与第一像素相似的第二像素的集合,在标注结果图像上显示第二像素的集合的位置。在上述方法中,在标注结果图像上显示的第二像素集合的位置可以视为画刷当前的形状,画刷的形状是根据相似性度量计算的,因此具有自适应性,有利于改善标注质量,提高标注效率。同时,该画刷的形状支持在标注结果图像上实时显示,使得标注员能够根据预览到的内容作出更为精确的标注行为,从而提高标注质量。
技术领域
本发明涉及图像标注技术领域,具体而言,涉及一种图像标注方法及装置、特征图生成方法及装置。
背景技术
图像语义分割和实例分割是计算机视觉领域的核心任务之一,其在自动驾驶、人像美化以及医疗图像分析等领域中都发挥着重要作用。随着深度学习的兴起,利用卷积神经网络进行语义和实例分割凭借其优异的性能成为了当前处理图像分割任务的主流方法。为训练图像分割用的网络模型,需要对原始图像进行逐像素的标注,即为每个像素指定一个表示其类别的标签。
现有的标注工具为标注员提供画刷,标注员通过肉眼观察的方式判断像素区域的类别,然后用画刷在像素区域中进行涂抹,将属于同一类别像素区域涂成同一种颜色,不同的颜色即可以作为标识不同类别的像素区域的标签。
然而,现有的画刷形状是固定的,当原始图像中不同类别的像素区域之间具有复杂的边界时,采用固定形状的画刷进行涂抹可能导致标注错误,如果反复切换画刷的尺寸又会导致标注效率低下。
发明内容
有鉴于此,本发明实施例提供一种图像标注方法及装置、特征图生成方法及装置,采用具有自适应形状的画刷进行标注,提高标注的精度和效率。
为实现上述目的,本发明提供如下技术方案:
第一方面,本发明实施例提供一种图像标注方法,包括:
当检测到标注用的画刷的第一操作时,确定第一操作对应的原始图像中的第一像素;
获取画刷范围内的每个第二像素与第一像素的相似性度量,其中,画刷范围是指画刷在原始图像上覆盖的包括第一像素的区域;
根据相似性度量确定与第一像素相似的第二像素的集合,在标注结果图像上显示第二像素的集合的位置。
在上述方法中,在标注结果图像上显示的第二像素集合的位置可以视为画刷当前的形状,该形状是根据第一像素与第二像素的相似性度量计算的,相当于根据相似性度量对标注结果作了自动推荐,因此其形状具有自适应性,例如在原始图像中不同类别的像素区域之间的边界处进行标注时,该画刷能够自适应边界的形状,从而有利于改善标注结果的质量,提高标注员的标注效率。另一方面,该画刷的形状支持在标注结果图像上实时显示,相当于可以对标注结果进行预览,从而使得标注员能够根据预览到的内容作出更为精确的标注行为,从而提高标注质量。
在一些实施例中,相似性度量根据第一像素与第二像素在特征空间中的距离进行计算,特征空间为第一特征图中的像素对应的向量所在的向量空间,第一特征图是利用卷积神经网络对原始图像进行特征提取后获得的。
一方面,原始图像中的像素之间可能存在噪声干扰,将原始图像中的像素映射到特征空间以后,可以减小噪声的影响。另一方面,原始图像中的像素之间语义关联性不清晰,而特征图由于经过了卷积神经网络的处理,其中的每个像素具有一定的感受野,从而相互之间具有更清晰的语义关联性。综合以上两方面,利用特征图上的像素(原始图像上的像素映射到特征空间就是映射为特征图上的像素)之间的距离来计算相似性度量,能够更准确地表征第一像素与第二像素的相似程度。
在一些实施例中,相似性度量根据第一像素与第二像素在原始图像上的距离,以及第一像素与第二像素在特征空间中的距离进行计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811584634.0/2.html,转载请声明来源钻瓜专利网。