[发明专利]视觉小目标自动标注方法、装置及电子设备有效
申请号: | 202010176644.1 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111401229B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 田光亚 | 申请(专利权)人: | 中科创达软件股份有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/80 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
地址: | 100083 北京市海淀区清华东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视觉 目标 自动 标注 方法 装置 电子设备 | ||
本公开实施例中提供了一种视觉小目标自动标注方法、装置及电子设备,属于数据处理技术领域,该方法包括:将包含视觉小目标的视频帧进行分类,得到第一类视频帧和第二类视频帧,使得每个相邻第一类视频帧之间包括一个或多个第二类视频帧;采用顺序方式,分别对所述第一类视频帧和第二类视频执行目标检测和跟踪处理,得到第一检测结果;采用逆序方式,分别对所述第一类视频帧和第二类视频执行目标检测和跟踪处理,得到第二检测结果;采用极大值抑制的方式,对所述第一检测结果和所述第二检测结果进行融合处理,以得到用于进行小目标自动标注的最终标注结果。通过本公开的处理方案,能够提高视觉小目标的自动标注效率。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种视觉小目标自动标注方法、装置及电子设备。
背景技术
数据标注是一类人工开销很大的劳动密集型工作。其主要依赖人类的知识,为视觉数据做一些标记,学术上称之为Ground Truth(真值)。而人工智能算法就是试图建立一个数学模型,通过学习可以模拟人类的知识,使人工智能做出类似于人类智能的判断。
获得数据标注往往需要极大的代价,每一个熟练的数据标注工程师,通过简易工具每天仅能标注几百乃至千余个标注框。而人工智能训练需要的数据确实无比巨大的。
数据标注的质量也会直接影响着人工智能算法的精度。而人类在从事此类枯燥、机械的工作中,难免出现疲劳,会严重影响数据标注质量。
人工智能算法训练对海量数据的需求与人类标注的低下效率存在矛盾,机械且枯燥的工作内容与对工作的高质量要求存在矛盾。。
发明内容
有鉴于此,本公开实施例提供一种视觉小目标自动标注方法、装置及电子设备,以至少部分解决现有技术中存在的问题。
第一方面,本公开实施例提供了一种视觉小目标自动标注方法,包括:
将包含视觉小目标的视频帧进行分类,得到第一类视频帧和第二类视频帧,使得每个相邻第一类视频帧之间包括一个或多个第二类视频帧;
采用顺序方式,分别对所述第一类视频帧和第二类视频执行目标检测和跟踪处理,得到第一检测结果;
采用逆序方式,分别对所述第一类视频帧和第二类视频执行目标检测和跟踪处理,得到第二检测结果;
采用极大值抑制的方式,对所述第一检测结果和所述第二检测结果进行融合处理,以得到用于进行小目标自动标注的最终标注结果。
根据本公开实施例的一种具体实现方式,所述将包含视觉小目标的视频帧进行分类,得到第一类视频帧和第二类视频帧,包括:
遍历目标视频中的全部视频帧;
每间隔m帧,标记一帧为第一类关键帧;
将第一类关键帧以外的其他视频帧被标记为第二类关键帧,其中,所述第一类关键帧用于目标检测,所述第二类关键帧用于目标跟踪。
根据本公开实施例的一种具体实现方式,所述采用顺序方式,分别对所述第一类视频帧和第二类视频执行目标检测和跟踪处理,得到第一检测结果,包括:
采用顺序方式,在第一类视频帧上使用目标检测算法,获得待标注目标的位置和尺寸,将待标注目标的位置和尺寸作为跟踪处理的初始状态;
采用顺序方式,在与所述第一类关键帧相邻的第二类关键帧上使用跟踪算法,基于相邻帧,预估待检测的视觉小目标在当前帧上的位置和尺寸。
根据本公开实施例的一种具体实现方式,所述采用顺序方式,分别对所述第一类视频帧和第二类视频执行目标检测和跟踪处理,得到第一检测结果,包括:
在对所述第二类视频帧执行跟踪处理的过程中,当出现下一个相邻的第一类关键帧时,结束针对所述第二类视频帧的跟踪处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科创达软件股份有限公司,未经中科创达软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010176644.1/2.html,转载请声明来源钻瓜专利网。