[发明专利]一种视频及图像中目标任意角度标记方法在审
申请号: | 201710554693.2 | 申请日: | 2017-07-10 |
公开(公告)号: | CN107273937A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 任柯燕;李思洋;侯义斌;李润奇 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/36 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 图像 目标 任意 角度 标记 方法 | ||
技术领域
本发明属于计算机图像中目标检测识别领域,尤其涉及一种视频及图像中目标任意角度标记方法,用于提高算法的识别率。
背景技术
在视频目标跟踪及图像目标检测识别领域中,用于训练的正样本的标注准确性,对训练模型的精度起着重要作用。高精度的训练模型能够让算法更准确地检测和识别图像中的目标位置、形状、类别等特征。用于训练的正样本,通常根据所要完成的任务设计样本标注方式。
传统的目标检测和识别算法是用平行或垂直于图像XY轴的矩形框标记图像中的目标,对于在地面拍摄的视频或图像,目标往往平行或垂直于地面,用平行或垂直于图像XY轴的矩形框标记可以较为接近物体轮廓。然而,当目标在空中运动或在空中动态采集的视频或图像,其中的目标在图像中往往是任意角度的,传统的平行或垂直于图像XY轴的角度固定的矩形标注框必然包含较多实际上并不是目标而是目标周围背景的部分,这样的标注样本用于训练会降低算法效率甚至影响检测和识别的速度和准确率。因此本发明旨在根据目标在图像中的位置,设计任意角度目标标记工具,使得图像标记能尽可能贴近目标的真实形状,减少标记区域的无关背景面积,提高训练的效率和准确率,进而提高检测和识别的速度和准确率。
发明内容
本发明目的在于提供一种用于图像检测和识别中用于训练目标内容的标记方法。
本发明的特征在于标记方法与传统的方法的不同,有三种标记算法及每个目标身份编号方式:
1、任取3个及以上点,求包围正样本目标的任意角度(但不垂直于xy轴)最小外接矩形;
2、任取3个及以上点,求平行于XY轴的最小外接矩,而传统方法是通过拖拽形成的矩形框;
3、取任意点数,贴近于目标形状,连接每个点形成贴近目标形状的封闭编辑框;
4、对于用于视频目标跟踪的每一个目标,可以手工对目标编号,以便验证算法的跟踪性能。
本发明意在创新图像标记方式,使得图像标记能尽可能贴近目标的真实形状,减少标记区域的无关背景面积,提高训练的效率和准确率,进而提高检测和识别的速度和准确率。具体方式是根据一个多边形的外接矩形至少存在一条边与原多边形重合定理,利用数学函数通过建立凸外形并且旋转外形以寻找给定点集的最小面积的包围矩形最小外接矩形。至少标记三个目标的边缘点,算法就能求出最小包围面积的外接矩形,所以可以根据实际情况,将目标最突出的点标记后,算法函数会自动求出最小包围面积的外接矩形。这样的方法与传统方法相比更加灵活和高效,矩形角度不再固定,标记的矩形框更好的贴近真实的目标形状,尽可能减少了无关部分的面积。
为实现上述目的,本发明采用如下的技术方案:
一种视频及图像中目标任意角度标记方法,包括以下步骤:
步骤(1)、加载一张或多张图片;
步骤(2)、选择一张图片,在图像中标记目标突出点,更具实际情况至少标记三个点;
步骤(3)、根据输入点集,利用函数寻找点集的最小包围面积的外接矩形,或者根据实际需要直接标记出多边形;最小外接矩形函数计算并返回指定点集的最小区域边界矩形,输出是矩形的四个点坐标;
步骤(4)、可选择给标记框加上ID,可以用于训练跟踪算法在不同帧识别同一个的目标;
步骤(5)、人工确认目标被正确标记后可选择是否删除标记框,添加或删除其中的标记点重新执行步骤(3)(4),生成标记框供用户确认;
步骤(6)、用户确认后决定是否在这张图片上继续标记其他目标;
步骤(7)、标记完所有目标后手动结束标记,软件自动生成用于训练的txt和xml文件;
步骤(8)、用户决定是否标记剩余图片,或者重新执行步骤(1)。
作为优选,步骤(3)中利用最小外接矩形函数,输入标记点,根据点集求出标记目标的最小外接矩形具体如下:
在初始xy坐标系中建立点集P={(x1,y1),(x2,y2),…,(xn,yn)|n≥3},同时生成标志集合B={b1,b2,…,bn},生成端点集合E={p1,p2,p3,p4,d}以及已旋转角度D,且初始值为0,s点集个数大于等于3且没有上限,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710554693.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序